ChatGPT: Como usar, para que serve e como funciona

Por Luciano Larrossa
24/01/2023 às 16:42 atualizado em (25/01/2023 às 15:09)
12min de leitura

ChatGPT é uma tecnologia revolucionária porque é treinada para aprender o que os humanos querem dizer quando fazem uma pergunta.

A ferramenta trata-se de uma Inteligência Artificial (IA) que pode ser muito útil para o seu dia-a-dia. Introduzida pela empresa OpenAI, empresa de inteligência artificial que Elon Musk investiu, o ChatGPT consegue responder, com alta precisão, a perguntas complexas por meio de conversação.

Muitos usuários ficam impressionados com sua capacidade de fornecer respostas de qualidade humana, inspirando a sensação de que pode eventualmente ter o poder de mudar a forma como os humanos interagem com os computadores e mudar a forma como as pesquisas por informações são feitas.

O que é ChatGPT?

ChatGPT é um grande chatbot (uma inteligência artificial para conversas) desenvolvido pela OpenAI baseado em GPT-3.5 (um modelo de linguagem autorregressivo que usa aprendizagem profunda para produzir texto semelhante ao humano). Ele tem uma capacidade notável de interagir na forma de diálogo de conversação e fornecer respostas que podem parecer surpreendentemente humanas.

Uma camada adicional de treinamento que usa feedback humano para ajudar o ChatGPT a aprender a capacidade de seguir instruções e gerar respostas satisfatórias para os humanos é a Aprendizagem por Reforço com Feedback Humano (RLHF).

Quem criou o ChatGPT?

O ChatGPT foi criado pela empresa de inteligência artificial OpenAI, com sede em San Francisco. A OpenAI é famosa por seu conhecido DALL·E, um modelo de aprendizado profundo que gera imagens a partir de instruções de texto chamadas de prompts.

A Microsoft é parceira e investidora da Open AI, no valor de US$ 1 bilhão. Eles desenvolveram em conjunto a plataforma Azure AI.

Grandes Modelos de Linguagem

ChatGPT é um Grande Modelo de Linguagem (em inglês, Large Language Model ou, como é mais conhecido, LLM). Os LLMs são treinados com grandes quantidades de dados para prever com precisão qual palavra vem a seguir em uma frase.

Descobriu-se que aumentar a quantidade de dados aumenta a capacidade dos modelos de linguagem. De acordo com a Universidade de Stanford (em tradução livre):

“O GPT-3 tem 175 bilhões de parâmetros e foi treinado em 570 gigabytes de texto. Para efeito de comparação, seu predecessor, o GPT-2, era 100 vezes menor, com 1,5 bilhão de parâmetros.

Esse aumento na escala muda drasticamente o comportamento do modelo — o GPT-3 é capaz de executar tarefas para as quais não foi explicitamente treinado, como traduzir frases do inglês para o francês, com poucos ou nenhum exemplo de treinamento.

Este comportamento foi ausente principalmente no GPT-2. Além disso, para algumas tarefas, o GPT-3 supera os modelos que foram explicitamente treinados para resolver essas tarefas, embora em outras tarefas fique aquém.”

Os LLMs prevêem a próxima palavra em uma série de palavras em uma frase e as próximas frases – como o preenchimento automático, mas em uma escala absolutamente maior. Essa habilidade permite que eles escrevam parágrafos e páginas inteiras de conteúdo, mas os LLMs são limitados porque nem sempre entendem exatamente o que um ser humano deseja.

E é aí que o ChatGPT entra em jogo, com o já mencionado treinamento de Aprendizagem por Reforço com Feedback Humano (RLHF).

Como o ChatGPT foi treinado?

O GPT-3.5 foi treinado em grandes quantidades de dados sobre código e informações da Internet, incluindo fontes como discussões do Reddit, para ajudar o ChatGPT a aprender o diálogo e atingir um estilo humano de resposta.

O ChatGPT também foi treinado usando feedback humano (uma técnica chamada Aprendizado por Reforço com Feedback Humano) para que a IA aprendesse o que os humanos esperavam quando faziam uma pergunta. Treinar o LLM dessa maneira é revolucionário porque vai além de simplesmente treinar o LLM para prever a próxima palavra.

Um artigo de pesquisa de março de 2022 intitulado Training Language Models to Follow Instructions with Human Feedback explica por que essa é uma abordagem inovadora (em tradução livre):

“Este trabalho é motivado por nosso objetivo de aumentar o impacto positivo de grandes modelos de linguagem, treinando-os para fazer o que um determinado conjunto de humanos deseja que eles façam.

Por padrão, os modelos de linguagem otimizam o objetivo de previsão da próxima palavra, que é apenas um pontapé inicial para o que queremos que esses modelos façam.

Nossos resultados indicam que nossas técnicas prometem tornar os modelos de linguagem mais úteis, verdadeiros e inofensivos.

Tornar os modelos de linguagem maiores não os torna inerentemente melhores em seguir a intenção do usuário.

Por exemplo, grandes modelos de linguagem podem gerar saídas que são falsas, tóxicas ou simplesmente não úteis para o usuário.

Em outras palavras, esses modelos não estão alinhados com seus usuários.”

Principais Diferenças De Outros Chatbots

O que diferencia o ChatGPT de um simples chatbot é que ele foi especificamente treinado para entender a intenção humana em uma pergunta e fornecer respostas úteis, verdadeiras e inofensivas.

Por causa desse treinamento, o ChatGPT pode contestar certas perguntas e descartar partes da pergunta que não fazem sentido.

Outro trabalho de pesquisa relacionado ao ChatGPT mostra como eles treinaram a IA para prever o que os humanos preferem.

Os pesquisadores notaram que as métricas usadas para avaliar as saídas da IA de processamento de linguagem natural resultaram em máquinas que pontuaram bem estatisticamente, mas não se alinharam com o que os humanos esperavam.

Explicação dos Pesquisadores

Os pesquisadores explicaram o problema da seguinte forma (em tradução livre):

“Muitos aplicativos de aprendizado de máquina otimizam métricas simples que são apenas proxies aproximados para o que o designer pretende. Isso pode levar a problemas, como recomendações do YouTube que promovem click-bait.”

Portanto, a solução que eles projetaram foi criar uma IA que pudesse gerar respostas otimizadas para o que os humanos preferiam. Para fazer isso, eles treinaram a IA usando conjuntos de dados de comparações humanas entre diferentes respostas, para que a máquina se tornasse melhor em prever o que os humanos julgavam ser respostas satisfatórias.

Quais são as limitações do ChatGPT?

Limitações quanto a Respostas Tóxicas

ChatGPT é especificamente programado para não fornecer respostas tóxicas ou prejudiciais. Portanto, evitará responder a esses tipos de perguntas.

Qualidade das Respostas Depende da Qualidade das Perguntas

Uma limitação importante do ChatGPT é que a qualidade da saída depende da qualidade da entrada. Em outras palavras, orientações de especialistas (prompts) geram melhores respostas.

Respostas Nem Sempre Corretas

Outra limitação é que os programadores treinaram o ChatGPT para fornecer respostas que pareçam corretas para os humanos, então as respostas podem enganar os humanos de que a informação está correta.

Muitos usuários descobriram que o ChatGPT pode fornecer respostas parcialmente incorretas, incluindo algumas totalmente incorretas. Por exemplo, uma usuária relatou ter obtido uma resposta de que os Elefantes são os mamíferos que põem os maiores ovos. Porém, é possível que isso se deva à incapacidade da IA de diferenciar cenários hipotéticos de cenários reais.

OpenAI Explica as Limitações do ChatGPT

O anúncio da OpenAI ofereceu esta ressalva (em tradução livre):

“O ChatGPT às vezes escreve respostas que parecem plausíveis, mas incorretas ou sem sentido.

Corrigir esse problema é desafiador, pois:

(1) durante o treinamento de RL, atualmente não há fonte de verdade;

(2) treinar o modelo para ser mais cauteloso faz com que ele recuse perguntas que pode responder corretamente; e

(3) o treinamento supervisionado engana o modelo porque a resposta ideal depende do que o modelo sabe, e não do que o demonstrador humano sabe.”

O ChatGPT é Gratuito?

Atualmente, o uso do ChatGPT é gratuito porém já existem rumores de que a versão paga o do ChatGTP pode sair em breve e custará 42 dólares por mês.

Atualmente, o chatbot está aberto para que os usuários experimentem e forneçam feedback sobre as respostas, para que a IA possa responder melhor às perguntas e aprender com seus erros.

O anúncio oficial afirma que a OpenAI está ansiosa para receber feedback sobre os erros (em tradução livre):

“Embora tenhamos feito esforços para fazer com que o modelo rejeite solicitações inapropriadas, às vezes ele responde a instruções prejudiciais ou exibe comportamento tendencioso.

Estamos usando a API de moderação para avisar ou bloquear certos tipos de conteúdo inseguro, mas esperamos que haja alguns falsos negativos e positivos por enquanto.

Estamos ansiosos para coletar feedback dos usuários para ajudar em nosso trabalho contínuo para melhorar este sistema.”

Como Usar o ChatGPT em Português Brasileiro?

1. Acesse o site do ChatGPT no seu navegador

Contudo, é possível que o serviço esteja fora do ar por conta da quantidade de usuários, mas não desanime! Normalmente, em poucos minutos, o serviço volta à ativa.

2. Inscreva-se no serviço

Atualmente, o serviço é gratuito, mas você precisa realizar o login com um usuário e senha. Se preferir, pode sincronizar o chat com sua conta Google ou Microsoft.

3. Comece a conversar

Escreva no campo de chat (sinalizado em vermelho) o seu comando ou pergunta – pode ser em português mesmo.

4. Aguarde a resposta do ChatGPT

No menu da esquerda, você pode criar uma nova conversa (“New Chat”) ou selecionar um papo anterior. Assim, não mistura seus assuntos.

Os Modelos de Linguagem Vão Substituir Buscas no Google?

O próprio Google já criou um chatbot AI que se chama LaMDA. O desempenho do chatbot do Google estava tão próximo de uma conversa humana que um engenheiro do Google afirmou que o LaMDA era senciente.

Dado como esses grandes modelos de linguagem podem responder a tantas perguntas, é improvável que uma empresa como OpenAI, Google ou Microsoft um dia substitua a pesquisa tradicional por um chatbot de IA?

Alguns Twitteiros já estão declarando que o ChatGPT será o próximo Google.

O cenário de que um chatbot de perguntas e respostas possa um dia substituir o Google é assustador para aqueles que ganham a vida como profissionais de marketing de busca. Isso gerou discussões em comunidades de marketing de busca online, como o popular Facebook SEOSignals Lab, onde alguém perguntou se as buscas poderiam mudar dos mecanismos de busca para os chatbots.

Tendo testado o ChatGPT, tenho que concordar que o medo de que a busca seja substituída por um chatbot não é infundado.

A tecnologia ainda tem suas limitações, mas já podemos vislumbrar um futuro híbrido onde os mecanismos de busca se unem a chatbots para buscarem informações.

Mas a atual implementação do ChatGPT parece ser uma ferramenta que, em algum momento, vai exigir a compra de créditos para usar.

Como Posso Usar o ChatGPT?

O ChatGPT pode escrever código, poemas, músicas e até contos no estilo de um autor específico.

A experiência em seguir instruções eleva o ChatGPT de uma fonte de informação a uma ferramenta que você pode solicitar para realizar uma tarefa.

Isso o torna útil para escrever artigos sobre praticamente qualquer tópico. O ChatGPT pode funcionar como uma ferramenta para gerar esboços de artigos ou até romances inteiros.

Ele fornecerá uma resposta para praticamente qualquer tarefa que um texto escrito possa responder.

O que o ChatGPT considera o que é o ChatGPT?

Para entrar um pouco na brincadeira, pedi ao ChatGPT para escrever um artigo sobre ele próprio. Essa foi a resposta.

“ChatGPT é um modelo de linguagem desenvolvido pela OpenAI. Ele foi treinado usando uma grande quantidade de dados de texto disponíveis na internet, o que o torna capaz de gerar respostas naturalistas e inteligentes a uma variedade de perguntas e tarefas de linguagem natural.

Assim, uma das principais características do ChatGPT é sua capacidade de compreender e responder a perguntas contextuais. Isso significa que ele pode entender o significado de uma pergunta e fornecer uma resposta precisa, mesmo que a pergunta não seja formulada de maneira exata. Além disso, ele também é capaz de gerar texto com fluidez e coesão, o que o torna útil para tarefas como geração de texto, resumo automático e tradução automática.

Outra vantagem do ChatGPT é sua escalabilidade. Como ele foi treinado em uma grande quantidade de dados, ele pode ser facilmente adaptado para uma variedade de tarefas e domínios específicos. Isso significa que ele pode ser usado para conversar com clientes, ajudar a redigir relatórios, responder perguntas técnicas e muito mais.

Além disso, o ChatGPT também é fácil de usar. Ele pode ser acessado através de uma API, o que significa que os desenvolvedores podem integrá-lo facilmente em aplicativos e sistemas. Isso tem permitido que ele seja usado em uma variedade de cenários, como assistentes virtuais, plataformas de comunicação e aplicativos de educação.

Em resumo, o ChatGPT é um modelo de linguagem poderoso e versátil desenvolvido pela OpenAI. Ele é capaz de compreender e responder a perguntas contextuais, gerar texto com fluidez e coesão, e ser facilmente adaptado para uma variedade de tarefas e domínios específicos. Ele também é fácil de usar, o que permite que ele seja usado em uma variedade de cenários.”

Conclusão

Como mencionado anteriormente, os desenvolvedores criaram o ChatGPT como uma ferramenta que o público eventualmente terá que pagar para usar. Mais de um milhão de usuários se registraram para usar o ChatGPT nos primeiros cinco dias desde que foi aberto ao público.

Pedi para o ChatGPT se despedir de vocês, e eis aqui o que ele me disse.

ChatGPT: Como usar, para que serve e como funciona

O que é ChatGPT?

Quem criou o ChatGPT?

Grandes Modelos de Linguagem