7
Fundacja Technologie dla Ludzi (@ftdl@pol.social)
pol.social@karma@101010.pl @smoku@vivaldi.net @bobiko
Tak, prowadzimy projekt #NapiGen służący generowaniu napisów oraz transkrypcji do materiałów audio i wideo w języku polskim i angielskim. Obsługuje on pliki wideo i audio oraz adresy url do materiałów na YouTube, PeerTube, Vimeo i innych obsługiwanych przez yt-dlp.
Wygenerowane napisy .srt i transkrypcje .txt gotowe do pobrania z systemu po przesłaniu plików / adresów url i przetwarzaniu przez specjalnie zmodyfikowanego Whisper.
Kilka osób i projektów już używa, można sprawdzić m. in. na stronach i podcastach Czaban robi raban, GilotynaTV, Discrust, Warroza czy Myśleć Głębiej.
Zapraszamy do kontaktu tutaj lub e-mailem na pomoc@ftdl.pl, by uzyskać dostęp. System jest bezpłatny do zastosowań niekomercyjnych, często decydujemy się udzielić bezpłatnego dostępu również projektom komercyjnym, gdy taki dostęp jest ważny ze względów społecznych czy edukacyjnych.
Niebawem projekt zostanie udostępniony jako open-source, ponieważ osiągnął już wg nas odpowiedni etap rozwoju, by się nim podzielić ze społecznością i przyspieszyć wspólnie jego rozwój.
Zapraszamy do kontaktu.
Tak się składa, że tydzień temu zgadaliśmy się z FTdL i od tej pory będę wspierać projekt od strony programistycznej. 🤓
<3