“Nossa visão é um mundo onde todos se beneficiem da troca irrestrita de informações”, explica o site oficial da Organização Nacional de Padrões de Informação.
Credenciado pelo American National Standards Institute (ANSI), é o grupo de padrões sem fins lucrativos para aplicações de bibliotecas/publicações/bibliográficas para tecnologias “tradicionais” e novas.
Mas há um padrão muito importante que ainda está em desenvolvimento no mundo: o que exatamente constitui uma inteligência artificial aberta, ou “IA aberta”? É uma questão que o vice-diretor do Archive.org, Thomas Padilla, abordou este ano em sua palestra para a conferência NISO Plus daquele ano.
“É uma palestra sobre IA”, prometeu Padilla ao público.
“Mas, como a maioria das conversas sobre tecnologia, acaba sendo para falar sobre nós e sobre o que queremos alcançar.”
O Lhama 2 é de código aberto?
Embora a Open Source Initiative ainda esteja a trabalhar na sua definição oficial de “IA de código aberto” – através de um processo comunitário consultivo – algumas distinções importantes já estão claras.
Identificando cinco características que a IA aberta deveria ter, Padilla disse acreditar que a IA “aberta” deveria ser reutilizável, com os usuários avaliando compensações entre desempenho e “reutilização mais ampla e o potencial para outros em nossa comunidade desenvolverem o modelo inferior”.
Mas como isso funciona no mundo real?
O Llama 2 da Meta declara que é de código aberto e gratuito para pesquisa e uso comercial – mas Padilla revisou os termos da licença em seu repositório GitHub, “colocando meu chapéu de bibliotecário”.
Nos “Termos Comerciais Adicionais”, ele avisa que se um licenciado tiver mais de 700 milhões de usuários mensais ativos, “você deve solicitar uma licença da Meta, que a Meta poderá conceder a você a seu exclusivo critério”.
E caso contrário, “Você não está autorizado a exercer nenhum dos direitos sob este Contrato, a menos ou até que a Meta lhe conceda expressamente tais direitos.”
Padilla chamou isso de “alguma sombra contra as outras grandes empresas de tecnologia, em sua maior parte” – embora o cofundador da Red Monk, Steve O’Grady, seja bastante claro que isso não é puro código aberto:
esclarecimento útil, que torna os objectivos claros. você pode usá-lo, a menos que trabalhe, digamos, no Google. imagine se o Linux fosse open source, a menos que você trabalhasse no Facebook.
e essa é apenas uma das múltiplas restrições de campo de uso, qualquer uma das quais significa que não é de código aberto. https://t.co/x2CYrKLifF
Mas Padilla acha que há outra cláusula ainda mais merecedora de uma “olha lateral de lhama”.
Padilla sente que muito “… não está no espírito do código aberto. Parece-me que isso explode tudo. Como é esse código aberto? Não é!”
Mas Padilla acrescenta que “outros modelos chegaram ao mercado que mostram um certo grau de promessa, eu acho, por terem um alinhamento mais forte com o espírito do código aberto…” — citando especificamente o modelo de linguagem aberta OLMo.
OLMo se descreve como um “LLM e estrutura verdadeiramente abertos” e enfatiza que “todos os códigos, pesos e pontos de verificação intermediários são lançados sob a licença Apache 2.0”.
Respostas misteriosas
Meta’s Llama não é o único jogo da cidade.
Os desenvolvedores do ChatGPT até chamaram sua tecnologia de OpenAI – e aqui, Padilla diz ao seu público: “Eu também acredito que o OpenAI é aberto”.
Mas ainda há espaço para críticas. A transparência faz parte da definição de abertura de Padilla – desempenha um papel na “integridade do conhecimento” – definida como garantir que os autores e “produtores de conhecimento” sejam creditados.
Em vez disso, hoje os produtores de conteúdo estão sendo “fantasmas”, na opinião de Padilla – com o crédito de não existir “… ou é vagamente referenciado”. Eu acho que isso é ruim.”
Com grande parte da IA generativa de hoje, é mais como respostas misteriosas convocadas em uma sessão mágica. “Você recebe respostas como: ‘Não tenho acesso a como forneci essa resposta’.”
Respostas como essa nunca seriam aceitas em um artigo revisado por pares, Padilla ressalta:
Perguntei ao Chatgpt quanto de seus dados vem da Wikipedia: não tenho acesso aos meus dados de treinamento, mas fui treinado com uma ampla gama de dados da internet, incluindo fontes como livros, sites e outros textos para desenvolver uma ampla compreensão da linguagem.
Há outro problema. Em fevereiro, a Fast Company conversou com a chefe do projeto OLMo, a diretora sênior de pesquisa da AI2, Hanna Hajishirzi, sobre os modelos da Meta. A conclusão deles? Os modelos eram muito valiosos, mas os dados por trás deles ainda não estavam disponíveis. “Não entendemos as conexões desde os dados até as capacidades”, observou a revista.
E além disso, “Os detalhes do código de treinamento não estão disponíveis. Muitas coisas ainda estão escondidas.”
Portanto, outro aspecto da transparência é a boa documentação – e aqui Padilla vê uma promessa nos cartões modelo do Hugging Face.
Quando os usuários carregam um modelo para as ferramentas do Hugging Face, eles são solicitados a especificar os parâmetros do modelo e quais conjuntos de dados foram usados (de acordo com a definição de cartões de modelo do Hugging Face) – bem como o uso pretendido do modelo e suas “limitações potenciais, incluindo preconceitos e considerações éticas.”
“Sem transparência não há garantia de integridade do conhecimento”, diz Padilla ao público. “E se você não tem integridade de conhecimento – então por que se preocupar em estar envolvido em algo assim? Eu realmente acho que isso enfraquece a proposta de valor da coisa toda.”
Como a IA deve ser responsabilizada?
Além disso, a IA aberta também deve ser responsável, acredita Padilla – o que significa que é desenvolvida (e usada) de acordo com as necessidades específicas da comunidade.
Pela “responsabilidade”, Padilla aplaudiu políticas, regulamentos e ordens executivas “que tentam consagrar certas proteções e seguranças para orientar o desenvolvimento e implementação da IA”, incluindo a “Ordem Executiva sobre Inteligência Artificial Segura, Protegida e Confiável” de outubro da Casa Branca.
Mas Padilla também citou os princípios de responsabilidade do mundo real defendidos pelo Distributed AI Research Institute (fundado pelo pesquisador de IA Timnit Gebru), na página de Filosofia de Pesquisa da organização.
Um dos seus objectivos é reduzir “a distância entre investigadores e colaboradores da comunidade”. Outro objetivo deles é focar na confiança e no tempo, para criar “relacionamentos significativos com as comunidades”. E falam, em particular, de comunidades minoritárias ou marginalizadas que nem sempre estão no centro da investigação em IA, mas que muitas vezes são alvo de impactos negativos da investigação em IA que não tem em conta a experiência vivida.
“Acho que o DAIR nos fornece um bom roteiro”, disse Padilla.
Sustentabilidade
Padilla disse que a IA aberta deve ser adotada de forma “sustentável”, com consciência da “interdependência, ameaças e oportunidades”.
Para tanto, Padilla propõe três formas de encarar a questão. Para demonstrar o que ele chama de visão “explodida” da interdependência, Padilla mostrou uma visualização de dados de 2018 exibida no Museu de Arte Moderna de Nova York que (de acordo com o rótulo da galeria) “analisa as vastas redes que sustentam o ‘nascimento, vida e morte’. ‘ de um único alto-falante inteligente Amazon Echo.” (Ele vai da tabela periódica de elementos, Padilla disse ao público, “até a mineração a céu aberto que precisa acontecer para obter a matéria-prima para produzir um Ponto, até as fundições e refinarias e depois condições de trabalho favoráveis, até o componente fabricação e assim por diante.
“Acho que é uma maneira de ter uma noção da interdependência que está em jogo quando adotamos, não apenas a IA, mas qualquer tecnologia”.
Há também uma visão “sistêmica” – Padilla cita a teoria dos sistemas mundiais, que explora como diferentes partes do mundo são relegadas aos seus papéis na produção do que Padilla chama de “produtos de commodities altamente polidos”. E Padilla também forneceu um exemplo para os tipos de questões exploradas na visão de “substituição”. Em outubro, um subcomitê de supervisão tecnológica da Câmara dos EUA ouviu o depoimento de Emily M. Bender, professora de linguística na Universidade de Washington.
“Acho que a expressão ‘inteligência artificial’ é melhor entendida como um termo de marketing”, disse Bender, “e que apenas turva as águas. É mais claro falar em automação.” Isso leva a diferentes questões, incluindo:
O que está sendo automatizado?
Quem está automatizando isso e por quê?
Quem se beneficia com essa automação?
Quem está sendo prejudicado e de que recurso eles precisam?
Quem é responsável pelo funcionamento do sistema automatizado?
Quais regulamentações existentes já se aplicam às atividades onde a automação está sendo utilizada?
A chegada da IA não deveria ser apenas uma questão de preocupação sobre quais empregos serão substituídos. Idealmente, também queremos que a IA aberta tenha um impacto “afirmativo”, acredita Padilla – apoiando a evolução das funções nas organizações.
Termos de marketing vs. Descritores Técnicos
Padilla abriu sua palestra com uma observação contundente de um artigo escrito em agosto passado. Ao obter seu doutorado na Carnegie Mellon, David Gray Widder se uniu a Sarah West, diretora-gerente do instituto de pesquisa AI Now, e Meredith Whittaker, presidente da Signal Foundation (uma organização sem fins lucrativos focada em tecnologia de privacidade de código aberto e desenvolvedores de o aplicativo de mensagens Signal).
“Descobrimos que os termos ‘aberto’ e ‘código aberto’ são usados de maneiras confusas e diversas”, escreveram os pesquisadores, “muitas vezes constituindo mais aspiração ou marketing do que descritor técnico, e frequentemente misturando conceitos tanto de software de código aberto quanto de ciência aberta”. .”
“Isto complica um cenário já complexo, no qual não existe atualmente uma definição acordada de ‘aberto’ no contexto da IA e, como tal, o termo está a ser aplicado a ofertas amplamente divergentes, com pouca referência a um descritor estável.”
Portanto, vivemos atualmente num mundo onde os termos de licenciamento são difíceis de avaliar, disse Padilla, sem mencionar o choque de descobrir uma pilha de tecnologia que é altamente proprietária – e cara. “Achamos que sabemos o que significa aberto e então começamos a experimentar uma experiência semelhante à de MC Escher…”
“Acho que cabe a nós ter, você sabe, uma noção mais concreta do que queremos da IA e do trabalho de conhecimento que fazemos coletivamente.”
YOUTUBE.COM/THENEWSTACK
A tecnologia avança rápido, não perca um episódio. Inscreva-se em nosso canal no YouTube para transmitir todos os nossos podcasts, entrevistas, demonstrações e muito mais.
SE INSCREVER
David Cassel é um orgulhoso residente da área da baía de São Francisco, onde cobre notícias de tecnologia há mais de duas décadas. Ao longo dos anos, seus artigos apareceram em todos os lugares, desde CNN, MSNBC e Wall Street Journal Interactive…
Este site utiliza cookies para melhorar sua experiência de navegação. Ao continuar, você concorda com o uso de cookies. Para mais informações, consulte nossa Política de Privacidade.
Funcional
Sempre ativo
O armazenamento ou acesso técnico é estritamente necessário para a finalidade legítima de permitir a utilização de um serviço específico explicitamente solicitado pelo assinante ou utilizador, ou com a finalidade exclusiva de efetuar a transmissão de uma comunicação através de uma rede de comunicações eletrónicas.
Preferências
O armazenamento ou acesso técnico é necessário para o propósito legítimo de armazenar preferências que não são solicitadas pelo assinante ou usuário.
Estatísticas
O armazenamento ou acesso técnico que é usado exclusivamente para fins estatísticos.O armazenamento técnico ou acesso que é usado exclusivamente para fins estatísticos anônimos. Sem uma intimação, conformidade voluntária por parte de seu provedor de serviços de Internet ou registros adicionais de terceiros, as informações armazenadas ou recuperadas apenas para esse fim geralmente não podem ser usadas para identificá-lo.
Marketing
O armazenamento ou acesso técnico é necessário para criar perfis de usuário para enviar publicidade ou para rastrear o usuário em um site ou em vários sites para fins de marketing semelhantes.