A propos d'Archivarix Tube Search

Archivarix Tube Search est un outil indépendant de recherche et d'archivage qui fournit une interface de recherche pour les métadonnées de vidéos YouTube archivées publiquement. Notre mission est de soutenir la préservation numérique, la recherche académique et l'intérêt public en rendant les données web historiquement archivées accessibles et consultables.

Comment ça fonctionne

Internet évolue en permanence. Les pages web, y compris les pages de vidéos YouTube, sont régulièrement capturées et préservées par des initiatives publiques d'archivage web telles qu'Internet Archive (Wayback Machine) et Common Crawl. Lorsqu'une vidéo YouTube n'est plus disponible pour quelque raison que ce soit, les métadonnées précédemment capturées par ces archives — notamment les titres, descriptions, dates de mise en ligne et sous-titres textuels — peuvent rester accessibles via leurs API et jeux de données publics. Archivarix Tube Search agrège et indexe ces données archivées publiquement pour les rendre consultables.

Ce que vous pouvez faire

Rechercher par URL de chaîne YouTube, @identifiant ou ID de chaîne pour explorer les métadonnées indexées des vidéos
Découvrir les métadonnées archivées de vidéos qui ne sont plus disponibles sur YouTube
Accéder aux sous-titres textuels préservés dans les archives web publiques
Vérifier si les fichiers vidéo ont été préservés par la Wayback Machine
Recherche en texte intégral dans les titres, descriptions et sous-titres indexés
Générer des sous-titres par IA via reconnaissance vocale pour les vidéos sans sous-titres archivés — y compris les vidéos supprimées dont la piste audio est préservée
Générer des résumés par IA (TL;DR, points clés horodatés, aperçu détaillé, étiquettes de sujets) à partir de n'importe quelle transcription — fonctionne également pour les vidéos supprimées
Générer des sténogrammes — transcriptions complètes du dialogue avec étiquettes de locuteurs, adaptées aux entretiens, podcasts, conférences et tables rondes — également disponibles pour les vidéos supprimées

Outils boostés par l'IA

Au-delà de la recherche dans les archives, Tube Search peut tirer une valeur supplémentaire de ce qui a été préservé :

Sous-titres IA. Lorsqu'une vidéo n'a pas de sous-titres archivés mais que sa piste audio est accessible (en direct ou via des fichiers préservés), la reconnaissance vocale automatique transcrit le contenu. Les sous-titres générés sont stockés aux côtés des sous-titres archivés et entrent dans la recherche en texte intégral.
Résumés IA. Un résumé structuré — TL;DR, points clés horodatés, aperçu détaillé, étiquettes de sujets — construit à partir de n'importe quelle transcription. Le résumé étant produit à partir du texte, il fonctionne tout aussi bien pour des vidéos déjà supprimées de YouTube, tant qu'une transcription existe dans notre index.
Sténogrammes. Un dialogue textuel complet reconstruit à partir de la transcription avec étiquettes de locuteurs, mis en forme comme une lecture propre. Utile pour les entretiens, podcasts, conférences et tables rondes. Comme les résumés, les sténogrammes fonctionnent pour les vidéos supprimées dont la transcription est encore archivée.

Sources de données

Toutes les données présentées par ce service proviennent de sources publiquement disponibles : l'API CDX de la Wayback Machine (Internet Archive), le jeu de données ouvert de Common Crawl et le jeu de données de recherche YouTube Metadata 2019. Nous n'effectuons aucun scraping, crawling ni accès direct à YouTube à des fins de collecte de données. Les miniatures et les textes de sous-titres sont récupérés à partir d'instantanés archivés stockés par des archives tierces. Toutes les vidéos renvoient directement vers leur page YouTube d'origine.

Aucune affiliation avec YouTube

Archivarix Tube Search n'est ni affilié, ni approuvé, ni lié à YouTube, Google LLC ou l'une de ses filiales. YouTube est une marque déposée de Google LLC. Ce service est un outil indépendant qui indexe des données archivées publiquement.

Suppression de contenu

Si vous êtes titulaire de droits et estimez que les métadonnées affichées sur ce service portent atteinte à vos droits, veuillez nous contacter en utilisant les coordonnées ci-dessous. Nous maintenons une procédure de suppression de contenu et répondrons rapidement aux demandes valides. Consultez nos Conditions d'utilisation pour plus de détails.

Créé par Archivarix

Ce projet est développé par l'équipe Archivarix, connue pour ses outils permettant de récupérer et de travailler avec du contenu web archivé. Visitez archivarix.com et archivarix.net pour en savoir plus sur nos autres projets.