Suche (neue) Kontaktperson nach Verlust von DB-Audiodateien

  • Wäre es nicht eine Möglichkeit, einfach eine Text-to-Speech AI zu Erstellung der Ansagen zu nutzen? Es gibt da mittlerweile echt ganz gute, die man auch gut verstehen kann. Lautstärke und Geschwindigkeit kann bei einigen Anbietern auch eingestellt werden. Oder vielleicht via einer API direkt in das Programm einbauen?!

  • Guten Abend Robby100


    TTS ist grundsätzlich eine gute Lösung, da es durch AI echt fortschrittlicher geworden ist. Jedoch habe ich bisher keine gute TTS gefunden, einige die ich ausprobiert hab sind:

    ● Linguatec (Aussprache sehr schlecht)

    ● ReadSpeaker (steht aktuell noch auf meiner Testliste, aber die haben sogar die Stimme der Blechelse, nur mit komplett anderer Aussprache und Betonung, deswegen schaue ich da noch wie sich alles anhört)

    ● Speechify (gleiche Stimmen wie Microsoft, nur billiger)

    ● ElevenLabs (momentan modernste TTS mit KI Technologie, hat aber ein Character Limit, das reicht für mich leider nicht vollständig aus, ein kleiner Teil fehlt)


    Und die anderen TTS Anbieter sind alles die Stimmen wie Microsoft und Google, nur "geklaut".


    Ansonsten eine gute Idee


    Vielen Dank und liebe Grüße

  • um eine der AI Stimmen passend (für dich) zu editieren.

    Das ist jedoch ne extreme Arbeit, wenn man das mit jeder Ansage dann einzeln machen muss. Das Pitchen muss hier auch gelernt sein, das es nicht klingt wie Helium. Auch währe es dann sehr wichtig sich die Einstellungen aufzuschreiben. Das auch wirklich alles gleich klingt...

    Rein theoretisch könnte man sich mit Kenntnis die Stimme von Alice Palmer selber erstellen. Computergeneriert. AI Stimme. Man braucht da jedoch sehr gute Vorlagen. Es gibt Programme die so etwas können.

  • Man kann bpsw. via Batch-Prozess die Erstellung der Audiodateien automatisieren, eine (halbwegs aktuelle) Liste mit Stationsdaten ist ja im Internet verfügbar. Für die Audiobearbeitung kann man Presets benutzen (und evtl. auch via Batch automatisieren). Aber ja, ist alles natürlich trotzdem, mehr oder minder viel Arbeit.

  • Mistral


    Das Problem ist ja auch – was ich vielleicht nicht klar genug erwähnt habe – die Kontaktperson an sich ist ja noch da, sie liest sogar meine Nachrichten (das wird amgezeigt) aber antwortet nicht. Das man mal keine Zeit und Lust hat verstehe ich, aber über mehrere Monate?

    Es wäre ja nur einmal hochladen und die Sache ist gegessen, dass dauert vielleicht 2 Minuten und schon wäre die Sache geklärt.


    Vorallem weiß er von meinen Einschränkungen. Ich muss ja sogar am Bahnhof einen Blinden/Begleithund mitführen und bin bald wieder viel unterwegs und da etwas verständliches zu haben wäre schon super.


    Mir würden ja schon die Bahnhöfe reichen, die auf "Hbf" enden. Plus natürlich die Zeiten, Arten und Nummern, logisch. Das wird am meisten gebraucht (ICE usw.).


    Das nur so am Rande nochmal.


    Einen schönen Abend!

  • trainhelpsystems4 die einzige und beste Möglichkeit die ich noch gefunden habe ist das Voice Cloning zwecks AI. Speechify soll wohl soetwas anbieten, ist jedoch sehr teuer, glaube 200€/Jahr wenn ich mich nicht irre. Da müsste man halt überlegen wie oft du mit dem Zug fährst und ob sich das lohnt. Zudem musst du dann immer noch alle Audioschnipsel auseinanderhacken. Da erscheint mir die Idee mit dem kleinen Team wieder sehr sinnvoll.


    Außerdem ist Datenschutz da ein anderes Thema. Speechify gibt an: "Stellen Sie sicher, dass Sie die Rechte an der Stimme besitzen".

    Du besitzt ja nur die Rechte zur Privaten Verwendung, ich glaube per Voice Cloning darfst du Sie gar nicht verwenden, da die Audiodateien ja auf Servern gespeichert werden, das entspricht dann nicht mehr deiner Lizenz, da es ja nicht mehr "Privat" ist. Würde ich persönlich also auch von abraten.


    Ist mir gerade beim schreiben noch eingefallen, gar nicht dran gedacht =O

  • Das kleine Team muss sich jedoch auch erstmal finden und abstimmen darauf, wer was spricht. Hier sehe ich persönlich schon Probleme. Ich kann mir vorstellen, das dies ein Projekt wird, was dann jedoch nie fertiggestellt wird. Das ist verdammt viel Arbeit das alles zu sprechen.

    Wegen einer Person, da ist denke ich ist die Nachfrage zu gering. Da währe es echt besser du gehst auf YouTube und schneidest dir das zusammen, wie du es braucht.


    Allerdings, wenn sich hier Leute finden lassen, die wirklich sprechen und nicht nur gross rumtönen sie machen es und nachher kommt nichts, dann könnte man vielleicht sogar hier so eine Art Ansagen-Datenbank erstellen. Mit allen Ansagen, die könnte man dann auch in Szenarien verwenden. Jedoch währe hier von Vorteil, gleiches Mikrofon, gleiches Programm. Sonst wirst du immer einen Qualitätsunterschied haben.

  • Also, ich finde hier die beste Lösung ist sogar, etwas eigenes zu entwerfen.

    Ob es jetzt eine eigene TTS oder halt Quasi eine eigene per KI erstellte Stimme ist.


    Klar, das erfordert viel technisches Verständnis und setzt einige Kenntnisse vorraus, jedoch von bisherigen Erfahrungen die ich hier gemacht habe sind für jeden Bereich kluge Köpfe dabei. Ich zum Beispiel habe mich schon immer gerne mit KI befasst. Ich weiß wie man künstliche Stimmen trainiert und dementsprechend einsetzt.


    Das hat mehrere Vorteile:

    ● Datenschutz wäre kein Thema, da es von uns allen ein Community Projekt wäre und ich für meine erstellten Stimmen sowieso keine Lizenzen oder so einen Quatsch verlange

    ● Es könnten alle Nutzen und nicht nur einer, die Nachfrage wäre vielleicht größer

    ● Wir können die Stimmen nach belieben der Nutzer ändern (Betonung, Aussprache usw.), das würde individuelles Gestalten ermöglichen


    Für die Aufteilung eines Teams könnte man eine Struktur entwickeln.


    Person 1: Kümmert sich um Zugarten und Zahlen + Uhrzeiten

    Person 2: Verspätungsgründe

    Person 3: Bayern

    Person 4: Baden-Württemberg

    usw....


    Außerdem könnte man es für verschiedene Zwecke verwenden:

    ● Ansagenerstellung für TS + TSW

    ● Blinden– Seh– und Hörgeschädigtenhilfe


    Wie gesagt, alles nur Theorien und Ideen, darüber quatschen und Ideen teilen kann man ja mal, nur ob die Umsetzung dann sinnvoll ist ist die Frage

  • Ich halte das selbst erstellen noch für am Besten. Da muss man auf keinen warten, hat keinen Stress, weil was nicht fertig wird. Hier gibt es Projekte die währen schon draussen, wenn es nicht die Leute geben würde, die sozusagen nie fertig werden. Deshalb selbermachen, eigenes Tempo wählen, Spass haben und fertig. Leute die praktisch nie fertig werden braucht keiner.

    Hier gibt es hier auch Andere, die es ernst meinen und einen sehr sehr guten Job machen, und uns an ihren Schöpfungen teilhaben lassen. Zuletzt die BR420 Modded. Super Arbeit.

    Aber leider sind genau diese Leute hier in der starken Minderheit vertreten.

    Von den ganzen Kiddies mir ihren Spaßprojekten fange ich gar nicht erst an...

  • Guten Abend, kurze Meldung:


    Das Thema allgemein kann geschlossen werden, die Kontaktperson hat zu mir wieder Kontakt aufgenommen und hat sich darum gekümmert. Am Community Projekt über das hier gesprochen wurde würde ich mich jedoch gerne beteiligen und das als tolles Projekt für die Zukunft sehen!


    Liebe Grüße und danke an euch!