A Karya é uma startup que coleta texto, voz e dados de imagens nas línguas faladas na Índia. Essa coleta permite que o chatbots de IA e assistentes virtuais construam uma base de dados para gerar respostas relevantes.
Fundada em 2021, a startup está presente em 22 estados da Índia e em mais de 100 distridos, empregando 70 trabalhadores contratados em Agara e aldeias vizinhas, com mais de 30 milhões de tarefas concluídas. Em menos de 3 anos de existência, a Karya já tem parceria com grandes nomes do mercado, são eles: Microsoft, MIT, Stanford University, J-Pal, Usaid e GIZ.
A Microsoft usou a Karya para obter dados de fala local para seus produtos de IA. O Google está inciando parceria com a Karya para coletar dados de fala em 85 distritos indianos. Com essa coleta, ambas podem expandir negócios e construir um modelo de IA gerativa para 125 idiomas indianos.
Quase um bilhão de usuários em potencial vivem na Índia, logo a implementação de ferramentas de IA em todas as esferas da sociedade, possibilita melhorar a qualidade de vida dos habitantes.
O fundador Manu Chopra
Formado em Ciências da Computação pela Universidade de Stanford, em 2017. foi cofundador do CS+Social Good, o primeiro grupo de estudantes de Stanford focado na interseção entre tecnologia e impacto.
Os dados que tornam possíveis os atuais sistemas de IA de ponta têm muitas vezes origem em fábricas no Sul Global, onde os trabalhadores trabalham por baixos salários para ensinar veículos autónomos a conduzir ou, cada vez mais, avaliar a fiabilidade dos chatbots. Ver isso em primeira mão levou Chopr a fundar a Karya: uma organização sem fins lucrativos que faria as coisas de maneira diferente. Karya não só paga aos seus trabalhadores pelo menos 5,00 dólares por hora (cerca de 20 vezes o salário mínimo indiano) pelo seu trabalho, como também os paga novamente sempre que uma empresa a licencia para construir uma nova IA. Grande parte do trabalho que Karya faz atualmente é coletar conjuntos de dados de línguas indianas que até agora foram marginalizadas pelo boom da IA. Esses dados irão para a construção de sistemas de IA nessas linguagens que funcionam não apenas com precisão, mas também de forma equitativa.