Nowa technologia potrafi zsyntetyzować każdy głos po pobraniu zaledwie 1 minuty referencyjnego dźwięku.

Abhimanyu Ghoshal, thenextweb.com USA 2017-05-05

Nauka i technologia

Nie jestem pewien jak powinienem się czuć w odniesieniu do uruchomienia nowej usługi Lyrebird z Montrealu. Firma twierdzi, że jej API pozwoli syntetyzować mowę wykorzystując głos każdego człowieka na bazie zaledwie kilku minut nagrania – co oznacza, że ​​możesz na przykład wygenerować nagranie prezydenta Trumpa, który wypowiedział wojnę Kanadzie.

Lyrebird opublikował kilka przykładów dźwiękowych, które brzmiały dość przekonująco. Firma mówi, że oprogramowanie nie wymaga aby mówca wymówił słowa, które będą używane w syntezie,
by oprogramowanie generowało dźwięk. Jest także możliwe tworzenie różnych intonacji.

Jeśli brzmi to znajomo, to być może dlatego, że myślisz o listopadowym pokazie programu Adobe prezentującego podobną technikę. Jednak podczas gdy projekt VoCo firmy Adobe wymaga wcześniejszego nagrania 20 minut dźwięku i wydaje się, że wykorzystuje zasoby systemu do syntezy mowy, to Lyrebird potrzebuje tylko minutowego nagrania. Firma twierdzi, że jest bliska uruchomienia swojego API opartego na chmurze w celu przetwarzania dźwięku i zapisywania wyników.

Jak rok temu napisałem gdy opisywaliśmy Projekt VoCo: jest prawdopodobnym, że takie oprogramowanie doprowadzi do stworzenia i dystrybucji mnóstwa mylących informacji w których autentyczność ludzie mogą uwierzyć.

Na swojej stronie poświęconej etyce, Lyrebird mówi, że ta technologia „kwestionuje ważność dźwiękowych dowodów, ponieważ pozwala na łatwe manipulowanie nagraniami audio”, dodając:
„Udostępniając publicznie naszą technologię i udostępniając ją dla wszystkich chcemy zapewnić, że nie wystąpią takie zagrożenia. Mamy nadzieję, że wkrótce każdy zda sobie sprawę z tego, że taka technologia istnieje, i że możliwe jest kopiowanie głosu kogoś innego. Ogólnie rzecz biorąc chcemy zwrócić uwagę na to, że w najbliższej przyszłości nagrania audio nie będą żadnym dowodem”.

Podobna technologia z obrazem wideo:


Lyrebird może mieć tu rację: szeroka dostępność narzędzi do manipulacji obrazem doprowadziła do tego, że ludzie podważają prawdziwość zdjęć w prasie i internecie, a także integralności ich źródeł. Jednak nadal istnieje ogromne ryzyko, że ludzie padną ofiarą oszustw i dezinformacji poprzez sfałszowany dźwięk.

I nie mówimy tu tylko o kopiowaniu głosów światowych liderów. Ludzie mogą zostać oszukani by przekazywali poufne dane myśląc, że rozmawiają z kimś innym lub z członkami rodziny, a pracownicy firm mogą wykonywać kompletnie mylne działania po tym jak otrzymają rozkazy przez telefon, od kogoś kto brzmi jak szef.

Link do oryginalnego artykułu: LINK

Nowe oprogramowanie „sztucznej inteligencji” posiada niemalże ludzkie zdolności rozpoznawania obrazów.  |  Właśnie upada ostatni bastion wolności. Dostęp do prywatności myśli.  |  Eric Schmidt: Sztuczna Inteligencja Google nie do odróżnienia od ludzkiej w przeciągu dekady.   |  Automatyczny system nadzoru DARPA zakończy publiczną anonimowość.  |  Google planuje wszczepianie implantów do mózgu.  |  E-maile ze Stratfor: Google stało za bliskowschodnimi zmianami reżimów.  |  Google i przejęcie władzy nad światem.   |  Google Chrome podsłuchuje wszystkie twoje rozmowy.   |  Google opatentowało wykorzystywanie “szumów otoczenia” do kierowania reklam.   |  Google i Apple zbierają dane z prywatnych komputerów.   |  Google usiłuje osłabić wyszukiwania wyników, dla stron zbierających informacje.  |  FBI działa by wprowadzić monitorowanie w czasie rzeczywistym poczty Gmail, Google Voice, Dropbox i usług w chmurze.   |  Przyszłość urządzeń mobilnych. Armia amerykańska chce wszczepiać żołnierzom nanoczipy.  |  NBIC- zabawa w Boga. Obraz świata w 2025 roku.  |  Zarządzanie tożsamością: Naukowcy badają dlaczego nie chcesz przyjąć wszczepianego czipa identyfikacyjnego.  |  Wystraszeni Meksykanie wypróbowują podskórne urządzenia lokacyjne.   |  Scenariusze przyszłości fundacji Rockefellera.   |  Jadalne radio identyfikacyjne czipy RFID.Naukowcy stworzyli system odczytywania obrazów ruchomych bezpośrednio z mózgu.  |  Rothschild i biometryka.  |  Chip zapisujący wspomnienia pozwala na ich transfer do drugiego mózgu.  |  Elektroniczny tatuaż „może zrewolucjonizować monitorowanie pacjentów”.

za: http://www.prisonplanet.pl/nauka_i_technologia/nowa_technologia_potrafi,p1190658682

Advertisements

Jedna odpowiedź to “Nowa technologia potrafi zsyntetyzować każdy głos po pobraniu zaledwie 1 minuty referencyjnego dźwięku.”

  1. mgrabas Says:

    Musisz to wiedzieć!(223) Niedługo nie będzie można uwierzyć w nagranie wideo? Popatrzcie!

    Opublikowany 7 cze 2017

Skomentuj

Wprowadź swoje dane lub kliknij jedną z tych ikon, aby się zalogować:

Logo WordPress.com

Komentujesz korzystając z konta WordPress.com. Log Out / Zmień )

Zdjęcie z Twittera

Komentujesz korzystając z konta Twitter. Log Out / Zmień )

Facebook photo

Komentujesz korzystając z konta Facebook. Log Out / Zmień )

Google+ photo

Komentujesz korzystając z konta Google+. Log Out / Zmień )

Connecting to %s