TruEra lança ferramenta gratuita para testar aplicativos LLM para alucinações

Deepset levanta US$ 30 milhões para ajudar empresas a desbloquear o valor dos LLMs

12 de janeiro de 2024

O AI Impact Tour da VentureBeat é lançado com foco na vanguarda da IA generativa e governança

12 de janeiro de 2024

Publicado por Guilherme Silva em 12 de janeiro de 2024

Categorias

Development

Por que TruLens para aplicações LLM?

Os LLMs estão na moda, mas quando se trata de construir aplicativos baseados nesses modelos, as empresas precisam passar por um cansativo processo de experimentação que envolve pontuação de respostas orientada por humanos. Essencialmente, uma vez desenvolvida a primeira versão de um aplicativo, as equipes precisam testar e revisar manualmente suas respostas, ajustar prompts, hiperparâmetros e modelos e, em seguida, testar novamente até que um resultado satisfatório seja alcançado.

Evento VB

O tour de impacto da IA

Chegando a um plano de governança de IA – Solicite um convite para o evento de 10 de janeiro.

Saber mais

Isso não só leva muito tempo, mas também é difícil de ampliar.

Com o TruLens, a TruEra está abordando essa lacuna introduzindo um método programático de avaliação chamado “funções de feedback”. Conforme explica a empresa, uma função de feedback avalia a saída de um aplicativo LLM quanto à qualidade e eficiência, analisando tanto o texto gerado a partir do LLM quanto os metadados da resposta.

“Pense nisso como uma forma de registrar e avaliar feedback direto e indireto sobre o desempenho e a qualidade do seu aplicativo LLM. Isso ajuda os desenvolvedores a criar aplicativos LLM confiáveis e poderosos com mais rapidez. Você pode usá-lo para uma ampla variedade de casos de uso de LLM, como resposta a perguntas de chatbot, recuperação de informações e assim por diante”, disse Anupam Datta, cofundador, presidente e cientista-chefe da TruEra, à VentureBeat.

TruLens para LLMs: como funciona

TruLens pode ser adicionado ao processo de desenvolvimento com algumas linhas de código. Quando estiver instalado e funcionando, os usuários poderão criar suas próprias funções de feedback — personalizadas para casos de uso específicos — ou usar as opções prontas para uso.

Atualmente, o software fornece funções de feedback que testam a veracidade, a relevância das respostas às perguntas, a linguagem prejudicial ou tóxica, o sentimento do usuário, a incompatibilidade de linguagem, a verbosidade das respostas e a justiça e preconceito. Além disso, ele também registra quanto um LLM está recebendo ping no aplicativo, proporcionando uma maneira fácil de rastrear os custos de uso.

“Isso também ajuda você a determinar como construir a melhor versão do aplicativo com o menor custo contínuo. Todos esses pings se somam”, observou Datta.

Outras ofertas para aplicações LLM

Embora testar aplicativos baseados em LLM quanto ao desempenho e precisão de resposta seja a necessidade do momento, apenas alguns players lançaram soluções para lidar com isso. Isso inclui a integração de monitoramento de modelo OpenAI da Datadog, a solução Pheonix da Arize e a recém-lançada solução de monitoramento de IA generativa da Mona Labs, com sede em Israel.

TruEra, por sua vez, afirma que TruLens é melhor usado na fase de desenvolvimento de aplicativos LLM.

“Na verdade, esta é a fase em que a maioria das empresas se encontra hoje – elas estão experimentando o desenvolvimento e realmente têm uma necessidade urgente de ferramentas que as ajudem a iterar mais rapidamente e a se concentrar em versões de aplicativos que sejam eficazes em suas tarefas e que minimizem os riscos. Você pode, é claro, usá-lo tanto em modelos de desenvolvimento quanto de produção”, disse Datta.

De acordo com um inquérito da Accenture, 98% dos executivos globais concordam que os modelos básicos de IA desempenharão um papel importante nas estratégias das suas organizações nos próximos três a cinco anos. Isso sinaliza que ferramentas como o TruLens em breve terão uma demanda crescente por parte das empresas.

A missão da VentureBeat é ser uma praça digital para os tomadores de decisões técnicas obterem conhecimento sobre tecnologia empresarial transformadora e realizarem transações. Conheça nossos Briefings.

Guilherme Silva

Comments are closed.

TruEra lança ferramenta gratuita para testar aplicativos LLM para alucinações

Deepset levanta US$ 30 milhões para ajudar empresas a desbloquear o valor dos LLMs

O AI Impact Tour da VentureBeat é lançado com foco na vanguarda da IA ​​generativa e governança

Deepset levanta US$ 30 milhões para ajudar empresas a desbloquear o valor dos LLMs

O AI Impact Tour da VentureBeat é lançado com foco na vanguarda da IA ​​generativa e governança

Por que TruLens para aplicações LLM?

Evento VB

Outras ofertas para aplicações LLM

Guilherme Silva

Postagens relacionadas

Exclusivo: VectorShift levanta US$ 3 milhões para modularizar o desenvolvimento de aplicativos LLM

Deepset levanta US$ 30 milhões para ajudar empresas a desbloquear o valor dos LLMs

Highlight lança plataforma full-stack de monitoramento de aplicativos e arrecada US$ 8 milhões

O AI Impact Tour da VentureBeat é lançado com foco na vanguarda da IA generativa e governança

O AI Impact Tour da VentureBeat é lançado com foco na vanguarda da IA generativa e governança