KI-Update kompakt: Voice Engine, Amazon Olympus, Supercomputer Stargate, Pixel 8

Diese Podcast-Folge behandelt verschiedene Themen im Bereich der künstlichen Intelligenz (KI). Zunächst wird über OpenAIs Voice Engine berichtet, ein Text-to-Speech-Modell, das Stimmen synthetisieren kann. Es wird erwähnt, dass das Modell im Vergleich zu anderen KI-Audiomodellen eine relativ lange Zeit benötigt, um die Stimme einer Person zu klonen. Weiterhin werden die Entwicklungen im Bereich der KI-Audiomodelle diskutiert, wobei große Unternehmen wie Google und Microsoft an der Entwicklung solcher Modelle arbeiten. Es wird betont, dass diese Modelle jedoch nicht frei verfügbar sind, da sie Missbrauchspotenzial bergen. Dennoch gibt es Unternehmen wie VoiceCraft, die bereits Open-Source-Modelle anbieten. Des Weiteren wird über die Investitionen und Fortschritte im Bereich der KI berichtet, wie z.B. Amazons Investitionen in das KI-Startup Anthropic und die Entwicklung des Sprachmodells Olympus. Darüber hinaus werden die Schwächen von KI-Texterkennungswerkzeugen beleuchtet und Googles KI-Modell Gemini Nano auf dem Pixel 8 erwähnt. Abschließend wird diskutiert, wie der Arbeitsspeicher die Ausführung von KI-Modellen auf Smartphones beeinflusst, wobei 8 GB RAM für das KI-Modell Gemini Nano ausreichend sind.

Outlines

Sign in to continue reading, translating and more.

Continue

KI-Update – ein heise-Podcast

OpenAIs Voice Engine: Stimmen synthetisieren mit nur 15 Sekunden Originalmaterial

KI-Audiomodelle: Fortschritte und Herausforderungen

KI-Investitionen und Fortschritte: Amazon, Microsoft und Midjourney

KI-Textdetektoren: Schwachstellen und der Einsatz von Gemini Nano auf dem Pixel 8

KI-Modelle auf Smartphones: Googles Pixel 8 im Test

KI-Update kompakt: Voice Engine, Amazon Olympus, Supercomputer Stargate, Pixel 8

KI-Update – ein heise-Podcast

00:02OpenAIs Voice Engine: Stimmen synthetisieren mit nur 15 Sekunden Originalmaterial

OpenAIs Voice Engine: Stimmen synthetisieren mit nur 15 Sekunden Originalmaterial

01:57KI-Audiomodelle: Fortschritte und Herausforderungen

KI-Audiomodelle: Fortschritte und Herausforderungen

04:05KI-Investitionen und Fortschritte: Amazon, Microsoft und Midjourney

KI-Investitionen und Fortschritte: Amazon, Microsoft und Midjourney

07:52KI-Textdetektoren: Schwachstellen und der Einsatz von Gemini Nano auf dem Pixel 8

KI-Textdetektoren: Schwachstellen und der Einsatz von Gemini Nano auf dem Pixel 8

11:41KI-Modelle auf Smartphones: Googles Pixel 8 im Test

KI-Modelle auf Smartphones: Googles Pixel 8 im Test