MIT KÜNSTLICHER INTELLIGENZ CONTENT DURCHSUCHBAR UND VERWERTBAR MACHEN
Die immer größer werdende Menge an Videos und anderen digitalen Inhalten stellt Unternehmen vor einer großen Herausforderung – es ist kaum noch möglich diese Inhalte manuell zu verarbeiten und sinnvoll zu nutzen. Berge an unstrukturierte Inhalte liegen in Medienarchiven, die nicht durchsuchbar bzw. Doch gerade diese sind ein w
esentlicher Bestandteil der Medienverwaltung, um sicherzustellen, dass Inhalte korrekt identifiziert werden. Wie können also Content-Inhaber und Anbieter von Inhaltsdiensten (CMS, DAM) sicherstellen, dass sie über die genauesten und aktuellen Daten verfügen, die ihnen helfen, ihre Inhalte zu finden, zu verwalten und zu monetarisieren? KI als Assistent für die Analyse von Medieninhalte
aiconix bietet mit seiner Plattform aingine einen KI-One-Stop-Shop für Content-Besitzer. Die Plattform analysiert, verschlagwortet und indiziert Audio, Video, Bilder und Texte und wandelt diese in präzise Metadaten um. Die Plattform bietet Zugang zu unzähligen KI-Anbietern ergänzt durch von aiconix entwickelte eigene Features. Dadurch haben Nutzer immer Zugriff auf die aktuellen KI-Technologien zur Verarbeitung von audio-visuellen Inhalten. Zu den meistgenutzten Features gehören die automatisierte
Transkription von Sprache (Audio und Video) in Text, die automatisierte Erstellung von Untertitel und Übersetzung sowie die automatisierte Gesichts- und Objekterkennung. Mit dem aidvice matching Service bietet aiconix eine einzigartige Lösung zum thematischen Abgleich von Inhalten unterschiedlicher Medienarten aus verschiedenen Kanälen, wie Medienarchive oder Sozialen Medien. für ein redaktioneller Text automatisiert ein thematisch passendes Video oder Bild aus dem eigenen Archiv gefunden werden oder ein thematischer Abgleich verschiedener Medienarten vorgenommen werden. Außerdem kann der Service für Audio und Video SEO genutzt werden sowie zum Screening von Social-Media-Kanälen und Profilen. Die Vorteile von KI-Technologien wie Speech und Image Recognition, Data Analytics oder Image Identification liegen auf der Hand: sie erleichtern die Arbeitsprozesse und schaffen einen Mehrwert. Ein guter Überblick über die heute verfügbaren KI-Technologien gibt das KI-Periodensystem. Audio- und Video-Transkription mit Hilfe von KI
Video- oder Audio-Dateien, z.B. von Interviews werden immer noch häufig manuell transkribiert und Live-Events wie z.B. Pressekonferenzen oder Vorträge werden selten mit Untertitel gestreamt. Dabei bieten KI-Technologien bereits sehr gute Lösungen im Bereich Speech-to-Text. Automatische Transkriptionslösungen verknüpfen akustische Laute mit Wörtern in einem digitalen Sprachmodell - ähnlich einem digitalen Wörterbuch. Wenn diese Laute mehrere mögliche Übereinstimmungen haben - zum Beispiel aufgrund von undeutlicher Aussprache - untersucht die automatische Transkriptionssoftware den Gesamtkontext und weist jedem möglichen Wort eine Wahrscheinlichkeit zu und wählt das Wort aus, das es für die wahrscheinlichste Übereinstimmung hält. Diese Analyse wird von Deep-Learning-Algorithmen gesteuert. Eine intelligente Software wandelt die Audiospur eines Videos in wenigen Augenblicken in Text um und liefert zusätzlich eine Untertitel-Datei, die in ein Video eingebunden werden kann. aiconix bietet diverse Transkriptionslösungen an. Die Speech-to-Text Lösung für Jedermann ist eine App, die in SLACK genutzt werden kann. Man fügt per Drag & Drop eine Audio- oder Video-Datei in den SLACK Messenger und erhält automatisch die Transkription sowie die Untertitel-Datei. Diese einfach zu nutzende App ist ideal z.B. für Studenten, die 100 Interviews transkribieren müssen oder für eine Fernsehproduktion, die Untertitel benötigt oder für Journalisten, die mit dem Smartphone Interviews aufnehmen und diese sehr schnell weiterverarbeiten wollen. Derzeit ist die Transkription in 9 Sprachen möglich und verfügbar mit der Zusatzfunktion das Transkript automatisiert in andere Sprachen zu übersetzen. Eine weitere Lösung von aiconix ist die Live-Transkription. Die meisten automatischen Transkriptionslösungen sind für die Nachbearbeitung konzipiert. Solche Postproduktionslösungen sind aber nicht für Live-Events wie Online-Konferenzen oder dem Streaming von Veranstaltungen geeignet. Wie es funktioniert? Stellen Sie sich einen Redner auf der Bühne vor, der eine Keynote-Rede hält. Das Mikrofon, in das er spricht, ist mit einem Laptop verbunden, auf dem eine Cloud-basierte automatische Transkriptionssoftware läuft. Alles, was der Redner sagt, wird als Audio-Datei an die Cloud gesendet und dort gleicht die KI-Technologie die verschiedenen Laute mit Wörtern in einem digitalen Sprachmodell ab. Die Software sendet dann den Text sofort zurück und dieser kann im Stream angezeigt werden, so dass jeder mitlesen kann. Die Daten, die die Software hoch- und herunterlädt, sind sehr klein, sodass der gesamte Prozess sehr schnell geschieht. Die Live-Transkription ist auch leicht verzögert möglich, damit ein Redakteur mit dem Live-Editor die Untertitel nochmal prüfen und eventuell nötige Korrekturen sofort vornehmen kann, bevor der Stream online geht. Mit Transkriptionen bzw. Untertiteln macht man die eigenen Inhalte für ein größeren Publikumskreis zugänglich, denn manche Personen können Videos z.B. aufgrund einer Hörbarriere nicht anhören oder sie möchten den Ton nicht anschalten und lieber mitlesen. Zudem können diese Transkripte weiterverarbeitet werden z.B. für eine Pressemitteilung, einen Blog-Beitrag oder für SEO. Zu den Kunden von aiconix gehören neben klassischen Medienunternehmen auch öffentliche Einrichtungen, ein Landtag sowie Nachrichtenredaktionen, mittelständischen Unternehmen und Hochschulen.