Texte durch Spracherkennung in Sekundenschnelle: iPhone- und Mac-Kurzbefehl mit >99 % Erkennungs-Genauigkeit dank Whisper API
Mit diesem Kurzbefehl kannst du deine Stimme ganz einfach in Text umwandeln, der automatisch in die Zwischenablage kopiert wird – ideal für Notizen, E-Mails oder kreative Ideen. Dank der Whisper API von OpenAI erreicht der Kurzbefehl eine Erkennungsgenauigkeit von über 99 %. Die Kosten liegen bei etwa $0,33 pro Stunde Spracherkennung – eine günstige und effiziente Möglichkeit, deine Arbeitsgeschwindigkeit zu steigern. Achtung: Beim Teilen des Kurzbefehls wird auch dein API-Key weitergegeben, also pass darauf auf. Hier erfährst du, wie du den Kurzbefehl einrichtest.
Angeregt und gefunden und auch der entwickelte Kurzbefehl stammt von Giacomo Melzi, veröffentlicht in einem Youtube-Video: https://www.youtube.com/watch?v=xykzZ_jX7Ww – also alle Credits gehen an ihn, ich habe dies hier Verschriftlicht und noch eine Anleitung hinzugefügt, wie ich es Nutze.
Schritt-für-Schritt-Anleitung zur Einrichtung des Kurzbefehls
1. Kurzbefehl hinzufügen
- Öffne dein iPhone und klicke auf den Link zum Kurzbefehl (https://www.icloud.com/shortcuts/f41c5791a88c49a0a7b4bbe935f70483)
- Tippe auf „Kurzbehfehl erhalten“ und folge dem Prozess, um den Kurzbefehl in deiner Kurzbefehle-App zu speichern.
- Der Kurzbefehl ist jetzt auf deinem iPhone und, falls aktiviert, auch auf deinem Mac verfügbar.
2. OpenAI-Konto erstellen
- Besuche die Website von Plattform für APIs OpenAI (https://platform.openai.com/docs/overview) und erstelle dir ein kostenloses Konto, falls du noch keines hast.
- Logge dich nach der Registrierung ein.
3. Guthaben aufladen
- Lade mindestens 10 Euro Guthaben auf dein OpenAI-Konto, damit du die API nutzen kannst, dies kannst du hier machen: https://platform.openai.com/settings/organization/billing/overview
- Das reicht für etwa 30 Stunden Spracherkennung.
4. OpenAI API-Key generieren
- Gehe in deinem OpenAI-Konto zu den API-Einstellungen (https://platform.openai.com/settings/organization/api-keys) und erstelle dort einen API-Key.
- Kopiere den API-Key, den du gleich einfügen wirst.
5. API-Key in den Kurzbefehl einfügen
- Öffne die Kurzbefehle-App und wähle den hinzugefügten Kurzbefehl aus.
- Bearbeite den Kurzbefehl, suche die Stelle, an der der API-Key eingefügt werden muss (siehe Screenshot), und füge deinen Key ein.
- Speichere die Änderungen und in dem du rechts oben auf „Fertig“ klickst.
6. Kurzbefehl nutzen
- Starte den Kurzbefehl, sprich deinen Text ein, klicke zum beenden, und er wird direkt in Textform in die Zwischenablage kopiert.
- Du kannst den Text jetzt überall verwenden, in dem du die „Einsetzen“ Funktion verwendest, dass geht eigentlich überall.
Hinweis: Ich empfehle es für kurze Inhalte zu benutzen, 1 bis 3 Minuten sind kein Problem. Pass auf, dass sich der Bildschirm nicht abschaltet (im Stromsparmodus bei iPhone z.B. nach 30 sec), sonst muss man von vorne starten. Hast du längere Texte, mache es besser auf mehrmals – in 1 von 50 Fällen muss man es auch mal wiederholen. Ab und zu reagiert auch der AssistiveTouch Punkt einfach nicht mehr, dann entweder warten oder einfach das Telefon erneut starten. In seltenen Fällen kommt auch mal nichts zurück, dann hat vielleicht die API gerade eine Störung, dass geht vorbei meist in ein paar Stunden.
Für lange Texte empfehle ich folgenden Telegram Dienst an dem man auch Sprachdateien der App Sprachmemos schicken kann oder Youtube Videos in Text umwandeln kann. https://t.me/my_voice_messages_bot?start=ref=1296492438 (Man benötigt allerdings ein Abonnement oder ein Pay-As-You-Go Vertrag, wird direkt im Bot abgeschlossen).
Anleitung zur Nutzung des AssistiveTouch Punktes um ohne Verzögerung eine Aufnahme zu Starten
Der AssistiveTouch Punkt ist ein Punkt der über allem drüber liegt und somit immer erreichbar.
Anleitung:
Gehe in die Einstellungen > Bedienungshilfen > Tippen (unter Physisch und Motorisch) > AssistiveTouch.
Nun schalte Assitive Touch oben an und dann unter eigene Aktionen wählst du bei Eigene Aktionen „Einfachtippen“ > unten unter Kurzbefehle „Speech-To-Text“ aus.
Du kannst dann noch die Deckkraft einstellen, für mich sind 40% im Standard gut.
Fertig.
Wichtige Hinweise
- Kosten: Die Whisper API von OpenAI kostet ca. $0,33 pro Stunde (Stand Nov. 2024) für die Spracherkennung.
- Datenschutz: Wenn du deinen Kurzbefehl teilst, wird auch dein API-Key weitergegeben. Verweise lieber auf diese Anleitung.
- Warum nutzen? Dieser Kurzbefehl spart dir Zeit und erhöht deine Produktivität. Perfekt für alle, die schnell Ideen oder Texte festhalten und weiterverwenden wollen.
Viel Spaß beim Einrichten und Nutzen! 🎤✨