Devonian Times Masthead

Neues von DEVONtechnologies

So transkribieren Sie Text in DEVONthink

24. Juni 2025 — Jim Neumann, Aaron Volkmann
Bildschirmfoto eines DEVONthink-Fensters mit dem geöffnetem Inspektor Annotationen & Erinnerungen. Im Annotationen-Feld ist eine Transkript mit Zeitstempeln zu sehen.

Haben Sie Audio- oder Video-Dokumente in Ihrer Datenbank in DEVONthink? Mit der Pro- oder Server-Edition können Sie ein KI-Modell verwenden, um die Audio zu einem Text transkribieren zu lassen. Das Transkript ermöglicht Ihnen zu lesen, was gesagt wurde, das Mediendokument über der Suche zu finden, Notizen zum Text zu machen oder durch die Audioaufnahme zu navigieren.

Öffnen Sie dazu zunächst Einstellungen > KI > Transkription und wählen Sie ein Ziel aus. Das legt fest, wo und wie die Transkription angelegt wird und gilt auch für die Texterkennung in Bildern. Sie haben folgende Möglichkeiten:

  • Durchsuchbarer Text: DEVONthink speichert den transkribierten Text unsichtbar im Index der Datenbank, sodass Sie nach Text im Mediendokument suchen können.
  • Annotation: Das erzeugt eine Annotation für das Mediendokument mit dem transkribierten Text. Die Annotation ist automatisch mit dem Mediendokument verknüpft. Sie finden das Transkript im Inspektor Info: Annotationen & Erinnerungen oder können es in einem separaten Fenster öffnen.
  • Kommentar: DEVONthink speichert den transkribierten Text als Finder-Kommentar im Mediendokument.

Wählen Sie nun im Abschnitt Audio & Video eine Engine für die Transkription aus. Eine gute Option ist die kostenlose Speech-Engine von Apple. Um die lokale Variante nutzen zu können, muss Siri aktiviert sein. Bei der Online-Variante senden Sie die Audiodaten zur Verarbeitung an die Server von Apple. Wir setzen jedoch Techniken zum Schutz der Privatsphäre für die gesendeten Daten ein. Eine weitere Option ist das Modell von OpenAI, für das Sie allerdings einen API-Key benötigen.

Aktivieren Sie Zeitstempel, um Zeitstempel aus der Audio zum Text hinzuzufügen, wobei DEVONthink mindestens einen Stempel pro Minute setzt. Wenn Sie das Transkript als Annotation sichern, fungieren die Zeitstempel als Verweise auf bestimmte Zeitpunkte in der Audioaufnahme. Und schließlich können Sie bei Bedarf eine bestimmte Sprache festlegen, obwohl die automatische Auswahl in vielen Fällen gut funktioniert.

Um nun die Transkription durchzuführen, wählen Sie die gewünschte Audio oder das Video aus und wählen Sie Daten > Erkennung > Sprache transkribieren aus dem Menü oder Kontext-Menü. Sie können die Aktion auch in Automatisierungen einbauen, also in Stapelverarbeitung, intelligente Regeln oder Skripte.