Allgemeines

Suchen Sie innerhalb eines Videos oder Audios im Internet

Suchen Sie innerhalb eines Videos oder Audios im Internet

Vorlesungsbrowser Ermöglicht die Suche nach Schlüsselwörtern in Videos von Klassen und Konferenzen im Internet

Laut diesem Technology Review-Artikel haben MIT-Forscher ein Audio- und Videosuchwerkzeug entwickelt, das eines der Hauptprobleme in diesem Bereich löst: Wie man eine große akademische Klasse in überschaubare Teile aufteilt, die Position von Schlüsselwörtern genau bestimmt und direkt an Benutzer zu ihnen. Diese Suchmaschine baut auf jahrzehntelanger Spracherkennungsforschung des MIT und anderer Institutionen auf, um Audio in Text umzuwandeln und darin zu suchen.

Der Vorlesungsbrowser ist zu einer Zeit entstanden, in der immer mehr Universitäten Videos und Podcasts ihrer Klassen online veröffentlichen. Obwohl der Inhalt sehr nützlich sein kann, ist es für Schüler schwierig und manchmal frustrierend, bestimmte Informationen innerhalb des Unterrichts zu finden, da sie es gewohnt sind, mit Google in weniger als einer Sekunde das zu finden, was sie benötigen.

"Es ist eines der größten Probleme für Universitäten im ganzen Land", sagt Jim Glass, ein Forscher am MIT. "Es ist eine echte Herausforderung zu wissen, wie man sie verbreitet und den Schülern den Zugang zu bestimmten Teilen der Klasse erleichtert, an denen sie interessiert sein könnten."

Die grundlegenden Elemente des Lecture Browsers gibt es seit mehr als 30 Jahren in Forschungslabors am MIT und anderswo, wie BBN Technologies, Carnegie Mellon, SRI International oder der University of Southern California. Ihre Initiativen haben zu Software geführt, die letztendlich gut genug ist, um den Durchschnittsmenschen anzuleiten, sagt Premkumar Natarajan, Wissenschaftler am BBN.

Einige Unternehmen, wie die Online-Video- und Audiosuchmaschinen Blinkx und EveryZing, verwenden bereits Software, die Audio in durchsuchbaren Text umwandelt. Die MIT-Forscher stießen jedoch bei der Verwendung für Vorlesungen auf einige spezifische Probleme. akademisch. Zum einen ist Englisch nicht die Muttersprache vieler Sprecher, was es für automatisierte Transkriptionssysteme schwierig macht, mit amerikanischen Akzenten zu arbeiten. Andererseits sind die Wörter, die im naturwissenschaftlichen Unterricht vorherrschen, oft wenig bekannt. Laut Regina Barzilay, Professorin für Informatik am MIT, haben Klassen eine sehr schlecht erkennbare Struktur, was es schwierig macht, ihre Inhalte zu teilen und zu organisieren, um die Suche zu erleichtern.

Um diese Probleme zu lösen, haben die Forscher zunächst die Software eingerichtet, die Audio in Text konvertiert. Sie trainierten die Software, um bestimmte Akzente zu verstehen, indem sie kurze Abschnitte von Audioaufnahmen präzise transkribierten. Um der Software zu helfen, ungewöhnliche Wörter zu identifizieren, stellten die Forscher ihr zusätzliche Daten zur Verfügung, z. B. Text aus Büchern und Vorlesungen, mit denen die Software vier von fünf Wörtern genau transkribieren kann. Wenn das System jedoch mit einer Person verwendet wird, deren Muttersprache nicht Englisch ist und für deren Akzent und Wortschatz das System nicht trainiert wurde, kann die Genauigkeit auf 50% fallen (eine so geringe Genauigkeit wäre für a nicht sinnvoll Transkription, aber ja für eine Stichwortsuche).

Video: Das Audio funktioniert nicht nach dem Windows 10 Update (Oktober 2020).