Produtos
O Not Diamond é um "roteador de LLM" que automatiza o processo de escolha do melhor modelo de resposta para você com base em suas entradas, escolhendo o modelo certo para a pergunta certa e otimizando continuamente os custos de uso do LLM.
Oferece a capacidade de ajustar de forma otimizada um conjunto completo de "LLM Model Routers", permitindo que você ajuste as regras de roteamento de forma personalizada.
Essa é uma ferramenta para desenvolvedores.
Ele está oferecendo ao usuário médio 100.000 usos gratuitos por mês de sua interface de bate-papo com IA... Não se engane, você pode digitar 100.000 vezes gratuitamente, obter 100.000 respostas e usar GPT-4o, Claude 3 Opus, Gemini 1.5 Pro, Perplexity, etc... Esses modelos grandes e caros.
Conjunto:Site espelho do ChatGPT (acesso doméstico aos modelos da série GPT4)
teoria
O Not Diamond recomenda automaticamente o melhor modelo de IA para cada mensagem e aprende em tempo real com base em seu feedback.
Quando você curte ou toca em uma resposta, o Not Diamond imediatamente descobre se o modelo está funcionando bem com suas dicas e usa seu feedback para melhorar as recomendações futuras. Para ver os resultados reais, você pode tentar tocar em uma resposta e fazer a mesma pergunta novamente.
Você também pode clicar no ícone de flash para gerar novamente essa resposta usando um modelo diferente e comparar como ela seria respondida.
O uso do Not Diamond é 100% gratuito. No entanto, cada resposta do LLM mostrará as métricas de latência e custo da resposta para que você possa comparar as diferenças.
⚔️ Você pode ativar o modo Arena a qualquer momento para comparar modelos em concorrência direta.
⚙️ Você pode selecionar e desmarcar LLMs específicos como opções clicando na guia Settings (Configurações).
✏️ Você pode editar os prompts do sistema para melhorar a resposta do Not Diamond às suas perguntas.
Para saber mais sobre como o Not Diamond funciona ou para integrar o roteamento de modelos em seu próprio aplicativo, clique no ícone Documentação do código.
É isso aí! Para começar, experimente enviar algumas mensagens e veja como elas são encaminhadas para o modelo certo. Não se esqueça de fornecer feedback para que a Not Diamond possa personalizar o roteamento de acordo com suas preferências.
Recursos funcionais
Treine seu próprio roteador
Você pode começar a usar o roteador básico do Not Diamond em menos de cinco minutos. Se você tiver seus próprios dados de avaliação, o Not Diamond permite que você treine um roteador personalizado otimizado para o seu caso de uso.
Velocidade de tirar o fôlego.
Ajudá-lo a escolher o melhor modelo no tempo necessário para processar tokens.
Equilíbrio inteligente entre qualidade e custo
Uso eficiente de modelos mais rápidos e baratos sem comprometer a qualidade.
Suporte à otimização das dicas de articulação
A programação das melhores pontas para cada LLM garante que o modelo e as pontas corretos sejam sempre usados. Não há necessidade de ajustes manuais e experimentação.
Interface de bate-papo
Selecione o modelo
Selecione o modelo que responderá à pergunta, marque o modo competitivo e dois serão selecionados entre os modelos para a comparação de respostas
Comparar e contrastar respostas
Resposta paralela, porque o modo competitivo está selecionado, de modo que a resposta de saída ocultará o modelo por padrão, e o modelo correspondente será exibido depois que a resposta for selecionada
limite de uso
A inserção de três perguntas e a chamada de dois modelos grandes para responder às perguntas cada vez consome a cota três vezes, ocupando trezentos milésimos da cota mensal.