- #1
Themenstarter/in
EDIT 17.08.2020:
Nochmals vielen Dank an alle die mitgemacht haben. Wir haben mittlerweile alle Teilnoten zusammen und konnten das finale Projekt funktionsfähig abgeben. Leider mussten wir kurzfristig improvisieren und die zu klassifizierenden Worte nochmals tauschen. Trotz zahlreicher Teilnehmer und Variation der Aufnahmen (engl. "Data Augmentation") konnten rund 1500 Aufnahmen pro Wort keine guten Ergebnisse liefern. Wir haben nach dieser bitteren Erkenntnis auf bestehende Datensätze zurückgegriffen und mit rund 5000 Aufnahmen pro Wort sehr gute Ergebnisse erzielen können – leider nicht mit den Aktionen/Worten die wir uns gewünscht hatten, aber immerhin.
Für die, die es ganz genau interessiert: für das Projekt haben wir 100 von 100 Punkten bekommen – nicht zuletzt auch durch das Engagement, einen eigenen Datensatz aufzubauen, was für viele KI Anwendungen das Bottleneck darstellt. Ihr habt uns also trotz Planänderung sehr sehr weitergeholfen! Danke an alle!
Worum geht es?
Im Rahmen eines Uniprojektes (Studienfach Informatik) trainieren wir eine künstliche Intelligenz darauf Sprachbefehle zu lernen und im Anschluss Aktionen auszuführen. Für das Training benötigen wir einen sehr breiten Datensatz von den Worten, die später verstanden werden sollen. Der Aufwand pro Person hält sich sehr im Rahmen, die große Menge an notwendigen Teilnehmern erschwert uns aber die Datensammlung im Freundes- und Bekanntenkreis.
Was wird gebraucht?
Pro Stimme reicht uns eine durchgängige Sprachaufnahme, in der die Worte create, delete, select, color, move, cube, sphere, plane, red, green, blue, white ausgesprochen werden – das war's.
Verwendung
Die Aufnahme wird von uns zerschnitten, automatisiert in Spektogramme zerlegt und dann angelernt. Ab diesem Zeitpunkt ist keine Zuordnung zwischen Stimme und Herkunft mehr möglich und damit alles anonym und ohne weitere Verwendung. Die Aufnahmen werden anschließend nicht mehr verwendet und nach dem abgeschlossenen Training gelöscht.
Wir würden uns freuen, wenn sich viele nette Menschen finden, die uns bei unserem (benoteten) Projekt unterstützen.
Viele Grüße und ein herzliches Dankeschön,
Alex
Nochmals vielen Dank an alle die mitgemacht haben. Wir haben mittlerweile alle Teilnoten zusammen und konnten das finale Projekt funktionsfähig abgeben. Leider mussten wir kurzfristig improvisieren und die zu klassifizierenden Worte nochmals tauschen. Trotz zahlreicher Teilnehmer und Variation der Aufnahmen (engl. "Data Augmentation") konnten rund 1500 Aufnahmen pro Wort keine guten Ergebnisse liefern. Wir haben nach dieser bitteren Erkenntnis auf bestehende Datensätze zurückgegriffen und mit rund 5000 Aufnahmen pro Wort sehr gute Ergebnisse erzielen können – leider nicht mit den Aktionen/Worten die wir uns gewünscht hatten, aber immerhin.
Für die, die es ganz genau interessiert: für das Projekt haben wir 100 von 100 Punkten bekommen – nicht zuletzt auch durch das Engagement, einen eigenen Datensatz aufzubauen, was für viele KI Anwendungen das Bottleneck darstellt. Ihr habt uns also trotz Planänderung sehr sehr weitergeholfen! Danke an alle!
Worum geht es?
Im Rahmen eines Uniprojektes (Studienfach Informatik) trainieren wir eine künstliche Intelligenz darauf Sprachbefehle zu lernen und im Anschluss Aktionen auszuführen. Für das Training benötigen wir einen sehr breiten Datensatz von den Worten, die später verstanden werden sollen. Der Aufwand pro Person hält sich sehr im Rahmen, die große Menge an notwendigen Teilnehmern erschwert uns aber die Datensammlung im Freundes- und Bekanntenkreis.
Was wird gebraucht?
Pro Stimme reicht uns eine durchgängige Sprachaufnahme, in der die Worte create, delete, select, color, move, cube, sphere, plane, red, green, blue, white ausgesprochen werden – das war's.
Verwendung
Die Aufnahme wird von uns zerschnitten, automatisiert in Spektogramme zerlegt und dann angelernt. Ab diesem Zeitpunkt ist keine Zuordnung zwischen Stimme und Herkunft mehr möglich und damit alles anonym und ohne weitere Verwendung. Die Aufnahmen werden anschließend nicht mehr verwendet und nach dem abgeschlossenen Training gelöscht.
Wir würden uns freuen, wenn sich viele nette Menschen finden, die uns bei unserem (benoteten) Projekt unterstützen.
Viele Grüße und ein herzliches Dankeschön,
Alex
Zuletzt bearbeitet: