A nova ferramenta do GitHub usa IA para criar código. Alguns desenvolvedores estão furiosos

Alguns desenvolvedores estão frustrados com a forma como a ferramenta de economia de tempo para programadores foi construída. Outros estão entusiasmados com seu potencial.

A nova ferramenta do GitHub usa IA para criar código. Alguns desenvolvedores estão furiosos

Uma ferramenta de programação de IA que torna o código de amostra mais fácil de encontrar pode soar como uma dádiva de Deus para desenvolvedores de software, mas a recepção para o novo Ferramenta GitHub Copilot foi um pouco mais frio.

O Copilot foi lançado na semana passada em uma Amostra Técnica apenas para convidados, prometendo economizar tempo respondendo ao código dos usuários com suas próprias sugestões inteligentes. Essas sugestões são baseadas em bilhões de linhas de código público que os usuários contribuíram publicamente para o GitHub, usando um sistema de IA chamado Codex da empresa de pesquisa OpenAI.

Embora o Copilot possa economizar muito tempo, alguns saudaram como mágica, ele também foi recebido com ceticismo por outros desenvolvedores, que temem que a ferramenta possa ajudar a contornar os requisitos de licenciamento para código-fonte aberto e violar os direitos autorais de usuários individuais.



tempo de voo de nova york para cingapura

Como funciona o Copilot

O GitHub descreve o Copilot como o equivalente de IA de programação em par , em que dois desenvolvedores trabalham juntos em um único computador. A ideia é que um desenvolvedor pode trazer novas ideias ou identificar problemas que o outro desenvolvedor pode ter perdido, mesmo que isso requeira mais horas-pessoa para fazer isso.

Na prática, porém, o Copilot é mais um economizador de tempo utilitário, integrando os recursos que os desenvolvedores poderiam ter que procurar em outro lugar. Conforme os usuários digitam no Copilot, a ferramenta sugere trechos de código para adicionar clicando em um botão. Dessa forma, eles não precisam perder tempo pesquisando na documentação da API ou procurando códigos de amostra em sites como StackOverflow. (Um segundo desenvolvedor provavelmente não teria memorizado esses exemplos também.)

Como acontece com a maioria das ferramentas de IA, o GitHub também deseja que o Copilot fique mais inteligente com o tempo, com base nos dados que coleta dos usuários. Relatórios CNBC que quando os usuários aceitam ou rejeitam as sugestões do Copilot, seu modelo de aprendizado de máquina usará esse feedback para melhorar as sugestões futuras, então talvez a ferramenta se torne mais humana à medida que aprende.

A reação

Pouco depois do lançamento do Copilot, alguns desenvolvedores começaram a soar alarmes sobre o uso de código público para treinar a IA da ferramenta.

comentário mais votado na história do reddit

Uma preocupação é que se o Copilot reproduzir pedaços grandes o suficiente do código existente, ele poderia violar direitos autorais ou efetivamente lavar código-fonte aberto para usos comerciais sem o licenciamento adequado. A ferramenta também pode cuspir detalhes pessoais que os desenvolvedores postaram publicamente, e em um caso código reproduzido amplamente citado do jogo de PC de 1999 Quake III Arena —Incluindo o comentário carregado de palavrões do desenvolvedor John Carmack.

Cole Garry, porta-voz do Github, se recusou a comentar sobre essas questões e apenas apontou para a existência de FAQ na página da web do Copilot , que reconhece que a ferramenta pode produzir trechos de código textuais a partir de seus dados de treinamento. Isso acontece cerca de 0,1% do tempo, diz GitHub, normalmente quando os usuários não fornecem contexto suficiente em torno de suas solicitações ou quando o problema tem uma solução comum.

Estamos construindo um rastreador de origem para ajudar a detectar as raras instâncias de código que são repetidas no conjunto de treinamento, para ajudá-lo a tomar boas decisões em tempo real sobre as sugestões do GitHub Copilot, afirma o FAQ da empresa.

Nesse ínterim, o CEO do GitHub, Nat Friedman, argumentou no Hacker News que treinar sistemas de aprendizado de máquina em dados públicos é uso justo, embora ele reconheça que IP e IA serão uma discussão política interessante na qual a empresa será um participante ansioso. (Como The Verge É David Gershgorn relatórios , esse fundamento legal ainda não foi testado.)

444 significado do número

A ferramenta também tem defensores fora da Microsoft, incluindo o engenheiro principal do Google Cloud, Kelsey Hightower. Os desenvolvedores devem ter tanto medo do GitHub Copilot quanto os matemáticos têm das calculadoras, ele disse .