◆ Revisitando: analisando os trending topics do Twitter ◆
Em setembro de 2021 publiquei Analisando os trending topics do Twitter - um experimento pequeno que usava a API do Twitter e o networkx para construir um grafo de co-ocorrência de hashtags. Cada trending topic virava um nó; duas hashtags que apareciam no mesmo tweet viravam uma aresta. O achado divertido na época: "tomate" estava conectando várias comunidades de discussão sem relação aparente, por motivos que nunca entendi por completo.
Relendo agora, quase tudo da encanação está morto. Quase tudo do método ainda funciona.
O que quebrou
A API do Twitter como existia em 2021 acabou efetivamente em 2023. O tier gratuito foi morto; o tier pago básico ficou caro o suficiente pra que scripts hobby como o do post original sejam inviáveis hoje. O endpoint search/tweets que alimentava a análise inteira está atrás de preço enterprise.
Ou seja: o código do post não roda mais, e não vale a pena tentar consertar onde ele está.
O que sobreviveu
O movimento analítico em si - pegar um fluxo de posts públicos, extrair tags co-ocorrentes, construir um grafo ponderado, olhar as comunidades - é agnóstico de plataforma. A plataforma morreu; o método sobreviveu. Lugares modernos pra apontar a mesma lente:
- Bluesky via o firehose do AT Protocol. De graça, aberto, completamente público, sem distopia de rate-limit. Provavelmente o mais próximo do "Twitter 2021" que a web social tem agora.
- Mastodon via timeline pública de relay ou instância. Federado, descentralizado, volume menor mas sinal mais limpo.
- Reddit via API oficial ou os sucessores do pushshift. Subreddits como comunidades naturais; grafos de comentário como estrutura de aresta.
- HackerNews via Firebase API. Corpus menor, mas 100% gratuito e denso em análogos de hashtag (títulos de stories, tags, domínios).
A parte interessante nunca foi "Twitter". Foi "como o grafo de co-ocorrência da conversa pública realmente se parece, e o que te surpreende quando você achata isso num grafo em vez de num feed?"
Onde isso viveria hoje
Se alguém fosse fazer isso em 2026, o lugar é o Bluesky. O firehose é infraestrutura honesta - stream inteiro, sem cobrança por query, schema documentado. A versão Twitter da web social aberta morreu. A versão Bluesky está viva, e o tipo de script pequeno e experimental que alimentou o post de 2021 ainda tem permissão pra existir lá. Era mais ou menos isso que eu queria registrar.