Sobre o Archivarix Tube Search
Archivarix Tube Search é uma ferramenta independente de pesquisa e arquivo que fornece uma interface de busca para metadados de vídeos do YouTube arquivados publicamente. Nossa missão é apoiar a preservação digital, a pesquisa acadêmica e o interesse público, tornando dados web historicamente arquivados acessíveis e pesquisáveis.
Como funciona
A internet está em constante mudança. Páginas web, incluindo páginas de vídeos do YouTube, são rotineiramente capturadas e preservadas por iniciativas públicas de arquivamento web, como o Internet Archive (Wayback Machine) e o Common Crawl. Quando um vídeo do YouTube fica indisponível por qualquer motivo, os metadados anteriormente capturados por esses arquivos — incluindo títulos, descrições, datas de upload e legendas em texto — podem continuar acessíveis através de suas APIs e conjuntos de dados públicos. O Archivarix Tube Search agrega e indexa esses dados arquivados publicamente para torná-los pesquisáveis.
O que você pode fazer
- Pesquisar por URL de canal do YouTube, @handle ou ID do canal para explorar metadados indexados de vídeos
- Descobrir metadados arquivados de vídeos que não estão mais disponíveis no YouTube
- Acessar legendas em texto preservadas em arquivos web públicos
- Verificar se arquivos de vídeo foram preservados pela Wayback Machine
- Pesquisa de texto completo em títulos, descrições e legendas indexados
- Gerar legendas com IA por reconhecimento de fala para vídeos sem legendas arquivadas — incluindo vídeos excluídos com áudio preservado
- Gerar resumos com IA (TL;DR, pontos-chave com marcações de tempo, visão geral detalhada, etiquetas de tópicos) a partir de qualquer transcrição — também funciona para vídeos excluídos
- Gerar estenografias — transcrições de diálogo completas com rótulos de falantes, ideais para entrevistas, podcasts, palestras e mesas-redondas — também disponíveis para vídeos excluídos
Ferramentas com IA
Além da busca direta em arquivos, o Tube Search pode extrair valor adicional do que foi preservado:
- Legendas com IA. Quando um vídeo não tem legendas arquivadas mas seu áudio está acessível (ao vivo ou via arquivos preservados), o reconhecimento automático de fala transcreve o conteúdo. As legendas resultantes são armazenadas junto com as arquivadas e entram na pesquisa de texto completo.
- Resumos com IA. Um resumo estruturado — TL;DR, pontos-chave com marcações de tempo, visão geral detalhada, etiquetas de tópicos — construído a partir de qualquer transcrição. Como o resumo é gerado a partir do texto, ele funciona igualmente bem para vídeos já excluídos do YouTube, desde que uma transcrição exista em nosso índice.
- Estenografias. Um diálogo de texto completo reconstruído a partir da transcrição com rótulos de falantes, formatado como leitura limpa. Útil para entrevistas, podcasts, palestras e mesas-redondas. Assim como os resumos, as estenografias funcionam para vídeos excluídos que ainda conservam uma transcrição arquivada.
Fontes de dados
Todos os dados apresentados por este serviço são derivados de fontes publicamente disponíveis: a API CDX da Wayback Machine (Internet Archive), o conjunto de dados abertos do Common Crawl e o conjunto de dados de pesquisa YouTube Metadata 2019. Não fazemos scraping, crawling ou acesso direto ao YouTube para coleta de dados. Miniaturas e textos de legendas são recuperados de snapshots arquivados armazenados por arquivos de terceiros. Todos os vídeos linkam diretamente para sua página original no YouTube.
Sem afiliação com o YouTube
Archivarix Tube Search não é afiliado, endossado ou conectado ao YouTube, Google LLC ou qualquer uma de suas subsidiárias. YouTube é uma marca registrada da Google LLC. Este serviço é uma ferramenta independente que indexa dados arquivados publicamente.
Remoção de conteúdo
Se você é titular de direitos e acredita que metadados exibidos neste serviço infringem seus direitos, entre em contato conosco usando as informações abaixo. Mantemos um processo de remoção de conteúdo e responderemos prontamente a solicitações válidas. Consulte nossos Termos de Serviço para mais detalhes.
Criado pela Archivarix
Este projeto é desenvolvido pela equipe Archivarix, conhecida por ferramentas que ajudam a recuperar e trabalhar com conteúdo web arquivado. Visite archivarix.com e archivarix.net para saber mais sobre nossos outros projetos.