Como devemos definir IA 'aberta'?

A IA generativa pode ajudar a resolver a lacuna de recursos de segurança cibernética?

31 de março de 2024

Os danos do backdoor do Linux xz podem ser maiores do que se temia

31 de março de 2024

Publicado por Douglas S. em 31 de março de 2024

Categorias

Data Science

O Lhama 2 é de código aberto?

Embora a Open Source Initiative ainda esteja a trabalhar na sua definição oficial de “IA de código aberto” – através de um processo comunitário consultivo – algumas distinções importantes já estão claras.

Identificando cinco características que a IA aberta deveria ter, Padilla disse acreditar que a IA “aberta” deveria ser reutilizável, com os usuários avaliando compensações entre desempenho e “reutilização mais ampla e o potencial para outros em nossa comunidade desenvolverem o modelo inferior”.

Mas como isso funciona no mundo real?

O Llama 2 da Meta declara que é de código aberto e gratuito para pesquisa e uso comercial – mas Padilla revisou os termos da licença em seu repositório GitHub, “colocando meu chapéu de bibliotecário”.

Nos “Termos Comerciais Adicionais”, ele avisa que se um licenciado tiver mais de 700 milhões de usuários mensais ativos, “você deve solicitar uma licença da Meta, que a Meta poderá conceder a você a seu exclusivo critério”.

E caso contrário, “Você não está autorizado a exercer nenhum dos direitos sob este Contrato, a menos ou até que a Meta lhe conceda expressamente tais direitos.”

Padilla chamou isso de “alguma sombra contra as outras grandes empresas de tecnologia, em sua maior parte” – embora o cofundador da Red Monk, Steve O’Grady, seja bastante claro que isso não é puro código aberto:

esclarecimento útil, que torna os objectivos claros. você pode usá-lo, a menos que trabalhe, digamos, no Google. imagine se o Linux fosse open source, a menos que você trabalhasse no Facebook.

e essa é apenas uma das múltiplas restrições de campo de uso, qualquer uma das quais significa que não é de código aberto. https://t.co/x2CYrKLifF

– Steve O’grady (@sogrady) 19 de julho de 2023

Mas Padilla acha que há outra cláusula ainda mais merecedora de uma “olha lateral de lhama”.

Padilla sente que muito “… não está no espírito do código aberto. Parece-me que isso explode tudo. Como é esse código aberto? Não é!”

Mas Padilla acrescenta que “outros modelos chegaram ao mercado que mostram um certo grau de promessa, eu acho, por terem um alinhamento mais forte com o espírito do código aberto…” — citando especificamente o modelo de linguagem aberta OLMo.

OLMo se descreve como um “LLM e estrutura verdadeiramente abertos” e enfatiza que “todos os códigos, pesos e pontos de verificação intermediários são lançados sob a licença Apache 2.0”.

Respostas misteriosas

Meta’s Llama não é o único jogo da cidade.

Os desenvolvedores do ChatGPT até chamaram sua tecnologia de OpenAI – e aqui, Padilla diz ao seu público: “Eu também acredito que o OpenAI é aberto”.

Mas ainda há espaço para críticas. A transparência faz parte da definição de abertura de Padilla – desempenha um papel na “integridade do conhecimento” – definida como garantir que os autores e “produtores de conhecimento” sejam creditados.

Em vez disso, hoje os produtores de conteúdo estão sendo “fantasmas”, na opinião de Padilla – com o crédito de não existir “… ou é vagamente referenciado”. Eu acho que isso é ruim.”

Com grande parte da IA generativa de hoje, é mais como respostas misteriosas convocadas em uma sessão mágica. “Você recebe respostas como: ‘Não tenho acesso a como forneci essa resposta’.”

Respostas como essa nunca seriam aceitas em um artigo revisado por pares, Padilla ressalta:

Perguntei ao Chatgpt quanto de seus dados vem da Wikipedia: não tenho acesso aos meus dados de treinamento, mas fui treinado com uma ampla gama de dados da internet, incluindo fontes como livros, sites e outros textos para desenvolver uma ampla compreensão da linguagem.

-James (Jim) McTague (@Mctaguej) 8 de dezembro de 2023

Há outro problema. Em fevereiro, a Fast Company conversou com a chefe do projeto OLMo, a diretora sênior de pesquisa da AI2, Hanna Hajishirzi, sobre os modelos da Meta. A conclusão deles? Os modelos eram muito valiosos, mas os dados por trás deles ainda não estavam disponíveis. “Não entendemos as conexões desde os dados até as capacidades”, observou a revista.

E além disso, “Os detalhes do código de treinamento não estão disponíveis. Muitas coisas ainda estão escondidas.”

Portanto, outro aspecto da transparência é a boa documentação – e aqui Padilla vê uma promessa nos cartões modelo do Hugging Face.

Quando os usuários carregam um modelo para as ferramentas do Hugging Face, eles são solicitados a especificar os parâmetros do modelo e quais conjuntos de dados foram usados (de acordo com a definição de cartões de modelo do Hugging Face) – bem como o uso pretendido do modelo e suas “limitações potenciais, incluindo preconceitos e considerações éticas.”

“Sem transparência não há garantia de integridade do conhecimento”, diz Padilla ao público. “E se você não tem integridade de conhecimento – então por que se preocupar em estar envolvido em algo assim? Eu realmente acho que isso enfraquece a proposta de valor da coisa toda.”

Como a IA deve ser responsabilizada?

Além disso, a IA aberta também deve ser responsável, acredita Padilla – o que significa que é desenvolvida (e usada) de acordo com as necessidades específicas da comunidade.

Pela “responsabilidade”, Padilla aplaudiu políticas, regulamentos e ordens executivas “que tentam consagrar certas proteções e seguranças para orientar o desenvolvimento e implementação da IA”, incluindo a “Ordem Executiva sobre Inteligência Artificial Segura, Protegida e Confiável” de outubro da Casa Branca.

Mas Padilla também citou os princípios de responsabilidade do mundo real defendidos pelo Distributed AI Research Institute (fundado pelo pesquisador de IA Timnit Gebru), na página de Filosofia de Pesquisa da organização.

Um dos seus objectivos é reduzir “a distância entre investigadores e colaboradores da comunidade”. Outro objetivo deles é focar na confiança e no tempo, para criar “relacionamentos significativos com as comunidades”. E falam, em particular, de comunidades minoritárias ou marginalizadas que nem sempre estão no centro da investigação em IA, mas que muitas vezes são alvo de impactos negativos da investigação em IA que não tem em conta a experiência vivida.

“Acho que o DAIR nos fornece um bom roteiro”, disse Padilla.

Sustentabilidade

Padilla disse que a IA aberta deve ser adotada de forma “sustentável”, com consciência da “interdependência, ameaças e oportunidades”.

Para tanto, Padilla propõe três formas de encarar a questão. Para demonstrar o que ele chama de visão “explodida” da interdependência, Padilla mostrou uma visualização de dados de 2018 exibida no Museu de Arte Moderna de Nova York que (de acordo com o rótulo da galeria) “analisa as vastas redes que sustentam o ‘nascimento, vida e morte’. ‘ de um único alto-falante inteligente Amazon Echo.” (Ele vai da tabela periódica de elementos, Padilla disse ao público, “até a mineração a céu aberto que precisa acontecer para obter a matéria-prima para produzir um Ponto, até as fundições e refinarias e depois condições de trabalho favoráveis, até o componente fabricação e assim por diante.

“Acho que é uma maneira de ter uma noção da interdependência que está em jogo quando adotamos, não apenas a IA, mas qualquer tecnologia”.

Há também uma visão “sistêmica” – Padilla cita a teoria dos sistemas mundiais, que explora como diferentes partes do mundo são relegadas aos seus papéis na produção do que Padilla chama de “produtos de commodities altamente polidos”. E Padilla também forneceu um exemplo para os tipos de questões exploradas na visão de “substituição”. Em outubro, um subcomitê de supervisão tecnológica da Câmara dos EUA ouviu o depoimento de Emily M. Bender, professora de linguística na Universidade de Washington.

“Acho que a expressão ‘inteligência artificial’ é melhor entendida como um termo de marketing”, disse Bender, “e que apenas turva as águas. É mais claro falar em automação.” Isso leva a diferentes questões, incluindo:

O que está sendo automatizado?
Quem está automatizando isso e por quê?
Quem se beneficia com essa automação?
Quem está sendo prejudicado e de que recurso eles precisam?
Quem é responsável pelo funcionamento do sistema automatizado?
Quais regulamentações existentes já se aplicam às atividades onde a automação está sendo utilizada?

A chegada da IA não deveria ser apenas uma questão de preocupação sobre quais empregos serão substituídos. Idealmente, também queremos que a IA aberta tenha um impacto “afirmativo”, acredita Padilla – apoiando a evolução das funções nas organizações.

Termos de marketing vs. Descritores Técnicos

Padilla abriu sua palestra com uma observação contundente de um artigo escrito em agosto passado. Ao obter seu doutorado na Carnegie Mellon, David Gray Widder se uniu a Sarah West, diretora-gerente do instituto de pesquisa AI Now, e Meredith Whittaker, presidente da Signal Foundation (uma organização sem fins lucrativos focada em tecnologia de privacidade de código aberto e desenvolvedores de o aplicativo de mensagens Signal).

“Descobrimos que os termos ‘aberto’ e ‘código aberto’ são usados de maneiras confusas e diversas”, escreveram os pesquisadores, “muitas vezes constituindo mais aspiração ou marketing do que descritor técnico, e frequentemente misturando conceitos tanto de software de código aberto quanto de ciência aberta”. .”

“Isto complica um cenário já complexo, no qual não existe atualmente uma definição acordada de ‘aberto’ no contexto da IA e, como tal, o termo está a ser aplicado a ofertas amplamente divergentes, com pouca referência a um descritor estável.”

Portanto, vivemos atualmente num mundo onde os termos de licenciamento são difíceis de avaliar, disse Padilla, sem mencionar o choque de descobrir uma pilha de tecnologia que é altamente proprietária – e cara. “Achamos que sabemos o que significa aberto e então começamos a experimentar uma experiência semelhante à de MC Escher…”

Captura de tela da palestra de Thomas Padilla no NISO Plus 2024 (quando a IA aberta parece uma pintura de MC Escher)

“Acho que cabe a nós ter, você sabe, uma noção mais concreta do que queremos da IA e do trabalho de conhecimento que fazemos coletivamente.”

David Cassel é um orgulhoso residente da área da baía de São Francisco, onde cobre notícias de tecnologia há mais de duas décadas. Ao longo dos anos, seus artigos apareceram em todos os lugares, desde CNN, MSNBC e Wall Street Journal Interactive…

Douglas S.

Comments are closed.

Como devemos definir IA ‘aberta’?

A IA generativa pode ajudar a resolver a lacuna de recursos de segurança cibernética?

Os danos do backdoor do Linux xz podem ser maiores do que se temia

A IA generativa pode ajudar a resolver a lacuna de recursos de segurança cibernética?

Os danos do backdoor do Linux xz podem ser maiores do que se temia

O Lhama 2 é de código aberto?

Respostas misteriosas

Como a IA deve ser responsabilizada?

Sustentabilidade

Termos de marketing vs. Descritores Técnicos

Douglas S.

Postagens relacionadas

Transparência por trás da cortina de IA generativa

Vamos ser agentes: agentes LangChain e LlamaIndex Talk AI

Como gerenciar 45 bilhões de registros de clientes com Aerospike