Um jogo de ‘gato e rato’ de vigilância com IA


Anthony “Bingy” Arillotta esperou anos para se tornar um homem feito na família criminosa genovesa e, quando finalmente recebeu o telefonema, em agosto de 2003, ele seguiu as instruções ao pé da letra. De acordo com juramento testemunhoArillotta foi convocado a uma churrascaria no Bronx, onde foi obrigado a entregar seu celular, bip e joias antes de ser levado a um prédio de apartamentos. Ao chegar lá, ele foi levado a um pequeno banheiro e revistado em busca de aparelhos eletrônicos. Para sua grande reunião com o chefe, ele ganhou um roupão para vestir.

Até recentemente, apenas espiões e criminosos tinham que se preocupar obsessivamente com o facto de as suas declarações privadas serem captadas por equipamento electrónico. Mas em breve, a pessoa média poderá precisar de implementar contramedidas de vigilância. Na próxima vez que você conduzir uma delicada diplomacia no escritório ou compartilhar um segredo romântico ou financeiro com um amigo enquanto bebe, um sensor embutido nos óculos, colar ou distintivo de lapela de alguém poderá estar observando você e ouvindo.

Em março, a start-up de tecnologia Deveillance anunciou o desenvolvimento do Spectre I, um dispositivo em forma de disco de hóquei que pretende impedir que outras pessoas gravem você (sem necessidade de revista). A empresa foi fundada por Aida Baradari, uma recém-formada que estava preocupada com o aumento de pessoas usando gravadores habilitados para IA. Esses wearables podem ser usados ​​como um anotador silencioso, um assistente pessoal ou até mesmo um terapeuta de alguma forma. Essa tecnologia ainda não é popular, mas poderá sê-lo em breve. Há rumores de que a Apple – a empresa com o maior ecossistema de tecnologia pessoal do mundo – está desenvolvendo um pin ou pingente de IA que serviria como olhos e ouvidos constantes de um iPhone; muitos outros produtos deste tipo estão a caminho. Os acessórios de IA poderão um dia ser tão difundidos quanto os AirPods.

As novas tecnologias de vigilância tendem a gerar novas contramedidas, que conduzem, por sua vez, a uma vigilância mais sofisticada. Durante a Segunda Guerra Mundial, depois que a Alemanha operacionalizou o radar, a Força Aérea Real começou a lançar tiras finas de papel metalizado cortadas em um tamanho específico que ressoava com o radar, inundando as telas alemãs com ecos fantasmas que eram indistinguíveis de aeronaves reais. Alguns historiadores argumentaram que a corrida armamentista de radar que se seguiu teve mais consequências para o resultado da guerra do que o Projeto Manhattan.

Durante décadas, bloqueadores brutos foram vendidos para pessoas que esperavam evitar serem gravadas. As primeiras versões emitiam um ruído branco alto e desagradável para esconder as vozes. Mais recentemente, as empresas criaram modelos que emitem um fluxo constante de som ultrassônico em frequências inaudíveis, explorando uma peculiaridade do hardware do microfone que converte essas altas frequências em ruído. Em 2020, uma equipe da Universidade de Chicago liderada por Yuxin Chen relatou que havia montado 23 transdutores ultrassônicos em uma única pulseira, de modo que os sinais de interferência pudessem ser enviado em todas as direções em vez de se concentrar em um único alvo.

Mas mesmo os bloqueadores de alta tecnologia têm dificuldade em se defender dos wearables de IA de hoje. Os alfinetes, pingentes e óculos mais avançados usam algoritmos de recuperação de fala para eliminar ruídos indesejados, sejam eles provenientes de fontes cotidianas – como o tilintar de copos em um bar lotado – ou de um bloqueador ultrassônico. Esta tarefa que os algoritmos realizam é ​​bastante difícil: naquele bar lotado, um microfone na lapela de uma pessoa interceptará vibrações sonoras de muitas fontes diferentes ao mesmo tempo. Ele captará um barman gritando um pedido de bebida, música emanando de um alto-falante, gargalhadas vindas de mesas próximas – e todos esses sons ricocheteiam nas paredes e em outros objetos, criando ainda mais barulho. O corpo humano resolve este “problema do cocktail” sem que percebamos: os nossos ouvidos funcionam como microfones duplos e o nosso cérebro pode utilizar as diferenças de tempo e intensidade entre eles, juntamente com o processamento em camadas no córtex auditivo, para isolar a voz de uma pessoa que está sentada à nossa frente.

DeLiang Wang, cientista da computação da Universidade Estadual de Ohio, passou décadas treinando redes neurais para atingir o mesmo objetivo, com o objetivo de melhorar os aparelhos auditivos. Ao alimentar as redes com centenas de horas de vozes humanas gravadas, ele ensinou-as a reconhecer as frequências e os ritmos da fala. Os modelos constroem uma representação interna da “fala” e, quando encontram uma gravação barulhenta, concentram-se nas partes que correspondem aos padrões que aprenderam e depois suprimem todo o resto. As tecnologias mais avançadas agora podem inferir sílabas faltantes da mesma forma que um leitor preenche uma palavra redigida do contexto, permitindo-lhe reconstruir a fala que não foi capturada de forma limpa em primeiro lugar.

As grandes empresas de tecnologia também estão tentando fazer isso. A Microsoft realiza um Desafio Anual de Supressão de Ruído Profundo desde 2020 para avançar no campo. (Sua equipe interna está tentando tornar as reuniões do Teams menos cansativas.) Outras empresas estão trabalhando no cancelamento de ruído para chamadas de celular e software de podcast. Este tipo de investigação destina-se a melhorar a vida dos utilizadores normais da tecnologia – assumindo que nós, ouvintes de podcast, contamos como normais – mas cada avanço na eliminação de ruído também pode ser usado para ajudar um assistente de IA a recuperar a fala de uma gravação encravada.

Derrotar esses algoritmos pode exigir uma abordagem de contravigilância totalmente diferente. Finn Brunton, historiador da UC Davis e coautor de Ofuscação: um guia do usuário para privacidade e protestome disse que uma das melhores maneiras é identificar os dados que um dispositivo está tentando coletar e, em seguida, fornecer-lhes uma versão lixo. O artista Adam Harvey, radicado em Berlim, usou essa estratégia quando desenvolveu maquiagem e roupas que frustram algoritmos de reconhecimento facial. Daniel Howe e Helen Nissenbaum fizeram algo semelhante com um plug-in do navegador chamada TrackMeNot: em vez de ocultar as pesquisas de um usuário no Google, a extensão executa continuamente suas próprias consultas falsas aleatórias em segundo plano, de modo que tudo o que um usuário realmente pesquisou se perde em um mar de pistas falsas.

As pessoas também tentaram essa técnica no domínio do áudio. Woodrow Hartzog, professor de direito da Universidade de Boston que estuda privacidade e vigilância, disse-me que, no início da sua carreira jurídica, trabalhou com advogados de defesa que temiam que as suas conversas na prisão com clientes fossem gravadas. Para revidar, eles tocaram “babble tapes” – arquivos de áudio com camadas de 40 faixas de vozes com sotaques diferentes – em segundo plano.

Em 2023, uma equipe liderada por Ming Gao, agora pesquisador da Universidade de Nanjing, usou vozes humanas para derrotar algoritmos de recuperação de fala de uma maneira diferente. Seu bloqueador, chamado MicFrozené usado por um locutor que não deseja ser gravado. Ele escuta enquanto eles falam e então gera um fluxo em tempo real de “anti-fala” ultrassônico sintonizado com a voz do locutor, muito parecido com a tecnologia de cancelamento de ruído em seus fones de ouvido. O dispositivo então envia outra camada de som falsificado em forma de fala para enganar qualquer algoritmo que tente reconstruir o que foi perdido.

Baradari, cuja empresa está trabalhando no dispositivo Spectre I, não quis me dizer exatamente como funcionam os sinais de seu jammer, mas disse que eles também se assemelham à fala. O vídeo de lançamento do Spectre I afirma que o dispositivo também será capaz de detectar a presença de microfones próximos. Quando perguntei a Baradari como isso seria feito, ela esclareceu que sua equipe ainda está “trabalhando nessa parte no momento”.

Por mais eficaz que o Spectre I seja, não será o fim da corrida armamentista da gravação. Modelos de IA mais capazes podem eventualmente implantar alguns novos truques de escuta próprios. Eles podem ignorar completamente o áudio gravado. Em Stanley Kubrick 2001: Uma Odisseia no Espaçoquando dois astronautas se retiram para uma cápsula à prova de som para discutir a desconexão do HAL 9000, o computador da nave simplesmente lê seus lábios através da vigia. Um wearable alimentado por um modelo treinado em imagens de conversas suficientes poderia, em princípio, fazer o mesmo. Em teoria, também poderia olhar para um copo de água entre duas pessoas e recuperar a fala delas. vibrações na superfície do líquido.

Os wearables de IA sempre podem ter uma vantagem sobre as contramedidas. Afinal, eles estão usando uma tecnologia que é produto de toda a indústria de processamento de fala, que gera bilhões de dólares em investimentos – não apenas em assistentes de IA, mas também em aparelhos auditivos, alto-falantes inteligentes e ferramentas de teleconferência. Entretanto, apenas alguns académicos e pequenas empresas nos defendem destas tecnologias. “O problema dos jogos de gato e rato é que sabemos como eles geralmente terminam para o rato”, disse Hartzog. “E, neste caso, o gato inclui algumas das corporações mais poderosas que já existiram.”

A Máfia sabe o que é ser um rato. Quando Arillotta, o aspirante a homem feito, foi instruído a vestir o roupão, as organizações criminosas já estavam envolvidas em corridas armamentistas de vigilância há décadas. Depois que as autoridades começaram a grampear seus telefones, os chefes passaram a conduzir os negócios pessoalmente. Às vezes, eles usavam uma casa segura ou um veículo, mas estes também poderiam estar grampeados e, portanto, informações confidenciais poderiam ter sido comunicadas apenas durante uma caminhada e conversa. Eventualmente, as famílias criminosas recorreram a telefones descartáveis ​​e, em seguida, a dispositivos com criptografia. Mas aqui, novamente, eles foram vítimas do gato.

Em 2018, o FBI começou executando anom secretamentesua própria empresa de telefonia criptografada. Através de informantes, vendeu 12 mil dispositivos com um aplicativo especial de mensagens Anom. Membros de famílias da máfia, gangues de motociclistas e outras organizações criminosas tratavam os telefones como um símbolo de status e os usavam para negociar negócios de drogas, lavar dinheiro e participar de todo tipo de outras atividades ilegais. Mas a segurança que ofereceram era um estratagema: todas as mensagens que enviavam eram interceptadas pelos federais.

Leave a Reply

Your email address will not be published. Required fields are marked *