Ogłoszenia Zwierzęta
Aktualności: Dar Życia poleca Kalendarz ze zdjęciami oraz Foto Karty, powołując się na nasze forum otrzymają Państwo rabat w postaci darmowej wysyłki PREZENTÓW. Kod rabatowy to słowo DAR ŻYCIA a strony to Foto Karty oraz Kalendarze ze zdjęciami

Autor Wątek: Ekranowa mowa-syntezatory mowy polskiej  (Przeczytany 5390 razy)

Offline sonia

  • User z prawami do pisania
  • Rozgadany Weteran
  • *******
  • Wiadomości: 25632
    • Dar Życia
Ekranowa mowa-syntezatory mowy polskiej
« dnia: Grudzień 14, 2004, 01:20:27 am »
Ekranowa mowa
AKTUALNOŚCI - OPROGRAMOWANIE z 13.12.2004
Oprogramowanie / Narzędzia audio / Programy do rozpoznawania mowy: Syntezatory mowy

Dostępne jest już pierwsze publiczne wydanie programu KTTS oznaczone numerem 0.2.0, który umożliwia konwersję tekstu na mowę. Aplikacja działa w linuksowym środowisku KDE
 
KTTS (KDE Text-to-Speech System) pozwala na konwersję na dźwięk jakiegokolwiek tekstu znajdującego się w schowku systemowym, plików w czystym formacie tekstowym, tekstów i zaznaczonych fragmentów z edytora Kate, stron HTML otwartych w przeglądarce Konqueror, a także komunikatów aplikacji Knotify.

Dłuższe teksty dzielone są na tzw. sekwencje, a każdą z nich użytkownik może zachować na dysku. Odtwarzany dźwięk można również zachować, zatrzymać lub przewinąć. Do obsługi plików dźwiękowych wykorzystywany jest system dźwięku aRts lub GStreamer w wersji 0.8.7 lub wyższej.
Więcej informacji:
KTTS - KDE Text-to-Speech System

Inne Syntezatory mowy

Andrzej Kwaśniewski
http://www.pcworld.pl/news/73393.html
Tam gdzie warto dotrzeć, nie ma dróg na skróty.
Sonia, mama Moniki z zD- 19,10l. , Domowa terapia

Pan Rajek

  • to weteran
  • polecający usługi
  • *******

Offline sonia

  • User z prawami do pisania
  • Rozgadany Weteran
  • *******
  • Wiadomości: 25632
    • Dar Życia
Tam gdzie warto dotrzeć, nie ma dróg na skróty.
Sonia, mama Moniki z zD- 19,10l. , Domowa terapia

Online Gaga

  • Administrator
  • Rozgadany Weteran
  • *****
  • Wiadomości: 26239
Ekranowa mowa-syntezatory mowy polskiej
« Odpowiedź #2 dnia: Wrzesień 27, 2006, 01:14:28 pm »
Polski syntezator mowy najlepszy na świecie >>>>

Polski syntezator mowy ludzkiej IVONA został uznany za najlepszy na świecie. Zwycięstwo Polaków w międzynarodowym konkursie Blizzard Chalenge ogłoszono na konferencji Interspeech 2006 w Pittsburghu (USA) - poinformował Łukasz Osowski, współautor technologii.
Cytuj
Program komputerowy, opracowany przez Łukasza Osowskiego i Michała Kaszczuka, pozwala osobom niewidomym pracować przy komputerze i korzystać z informacji umieszczonych w internecie
Pozdrawiam :))
"Starsza Wiosenna Miotełka"

Online Gaga

  • Administrator
  • Rozgadany Weteran
  • *****
  • Wiadomości: 26239
Ekranowa mowa-syntezatory mowy polskiej
« Odpowiedź #3 dnia: Wrzesień 09, 2007, 10:05:49 am »
Polski syntezator mowy ponownie nagrodzony

Polski syntezator mowy ludzkiej IVONA uzyskał jedną z 2 najlepszych ocen jakości mowy w prestiżowym konkursie Blizzard Challenge 2007.

Brało w nim udział 16 grup badawczych z ośrodków naukowych i firm, które zajmują się syntezą ludzkiej mowy z całego świata - poinformował PAP przedstawiciel firmy, która stworzyła IVONĘ, Andrzej Sowula.

Uczestnicy konkursu otrzymali nagrania głosu lektora, który miał posłużyć do stworzenia jego sztucznego odpowiednika. W ciągu jednego miesiąca wszyscy mieli opracować syntezator mówiący takim samym głosem, jak lektor. Po stworzeniu syntezatora, uczestnicy Blizzard Challenge 2007 otrzymali kilkaset zdań, które musieli odczytać sztucznym głosem. Przetworzony i odczytany tekst został odesłany do organizatorów konkursu, którzy oddali go do oceny ekspertom, grupie studentów brytyjskich i amerykańskich, a także ochotnikom z Internetu. Wszyscy oceniali anonimowe głosy, czytające ten sam tekst, nie zdając sobie nawet sprawy, który głos jest naturalny. Po podliczeniu ocen okazało się, że pośród najlepiej ocenionych sztucznych głosów znalazła się IVONA. Uzyskała ona średnią ocenę 3,9 punktów na 5 możliwych do zdobycia. Autentyczny głos lektora uzyskał wynik 4,7 punktów. Zbliżony rezultat do IVONY uzyskał tylko jeden inny syntezator mowy.

Triumf IVONY to powtórzenie sukcesu z Blizzard Challenge 2006, w którym jakość głosu syntezatora została uznana za najlepszą przez grupę oceniających ekspertów.
Tegoroczną, trzecią edycję konkursu Blizzard Challenge zorganizował Uniwersytet w Edynburgu.

"Rezultaty konkursu Blizzard Challenge 2007 pokazują, że z roku na rok coraz trudniej odróżnić głos prawdziwy i stworzony w sposób sztuczny. Postęp w jakości głosu jest naprawdę niesamowity, co widać choćby po IVONIE. W 2006 roku uzyskała ona wynik 3,6, co było najlepszą oceną w konkursie, a w tym roku poprawiła się o 0,3 punktów. Podobnie praktycznie wszyscy inni uczestnicy konkursu poprawili swoje ubiegłoroczne wyniki. Jest to dowodem na słuszność idei stojącej za Blizzard Challenge. Twórcom tego konkursu chodziło bowiem o to, żeby doprowadzić do wymiany doświadczeń pomiędzy ośrodkami naukowymi i firmami zajmującymi się syntezą mowy ludzkiej, tak żeby dać bodziec do jeszcze szybszego rozwoju tej dyscypliny naukowej" - tłumaczył Sowula.

Zdaniem Łukasza Osowskiego, prezesa zarządu IVO Software Sp. z o.o. udział w konkursie pozwolił firmie na porównanie polskiego systemu z najlepszymi syntezatorami mowy na świecie. "Dało nam to wiedzę, co powinniśmy poprawić i w jakim kierunku rozwijać IVONĘ. Tegorocznym wynikiem udowodniliśmy, że nasze zeszłoroczne zwycięstwo nie było przypadkiem. Dziś mamy już w pełni dojrzały system, który może zostać bardzo łatwo i szybko rozbudowany o kolejne języki. Obecnie na całym świecie oferujemy już IVONĘ użytkownikom indywidualnym w postaci popularnego programu o nazwie Expressivo. W najbliższej przyszłości planujemy także wypuszczenie na globalny rynek produktów dla firm, które będą oparte o syntezator IVONA" - podkreślił.
Pozdrawiam :))
"Starsza Wiosenna Miotełka"

Offline Emilianka

  • User z prawami do pisania
  • Wyjadacz
  • *****
  • Wiadomości: 3124
Ekranowa mowa-syntezatory mowy polskiej
« Odpowiedź #4 dnia: Listopad 13, 2007, 02:54:24 pm »
Polski syntezator mowy może podbić świat

Komputery już nie bełkoczą jak maszyny, mówią ludzkim głosem. Kiedy w tym głosie zagrają emocje? Do tego czasu trójmiejska firma Ivo Software ma szansę stać się ważnym graczem na światowym rynku komputerowej syntezy mowy.

Głosem podzielił się maszyną jeden z trójmiejskich aktorów. Który - to tajemnica. Dawca głosu boi się, że jeśli zdradzi swą tożsamość, to komputer - a raczej ten, który będzie komputerem sterował - może podszyć się pod niego w niecnym celu. Np. nabluzgać komuś jego głosem przez telefon.

Oddawanie głosu nie jest prostą sprawą. "Kilkadziesiąt lat temu taką samą robotę spełnił zgrzybiały dziś i obłąkany Jakub. Oto uczucia i myśli, na których gruncie wzrasta przyszła kobieta i obywatelka" - czytał po kolei aktor w gdańskim studiu nagraniowym. Takich zdań - które nie łączą się w żadną logiczną całość, mimo że ani jedno słowo w tekście nie jest przypadkowe - musiał wypowiedzieć kilkadziesiąt tysięcy.

Potem głos aktora wzięli w swoje ręce informatycy gdyńskiej firmy Ivo Software. Odpowiednio przetworzony, pocięty i obrobiony zamienił się w głos programu komputerowego, który automatycznie przekształca tekst pisany na mowę ludzką. Program nazywa się Ivona, a głos ochrzczono imieniem Jacek. Powie (prawie) wszystko to, co mu się każe. Może przeczytać żądany tekst, artykuły ze stron internetowych, książkę elektroniczną lub posłużyć jako lektor w filmie.

Kiedy przemówią budynki

Już niedługo, wróżą eksperci, zmieni się sposób kontaktu człowieka z komputerem. Miejsce klikania myszką zajmą komendy głosowe rozumiane przez komputer, który ze swej strony będzie przemawiał do użytkownika. Wtedy komputerowa mowa nabierze ogromnego znaczenia. - To nie wszystko. Mówić będą do nas także wirtualni konsultanci w centrach obsługi klienta, wszechobecne urządzenia nawigacyjne, inteligentne budynki, auta czy sprzęt AGD - przewiduje Łukasz Osowski, 29-letni szef i współwłaściciel Ivo Software.

Wiele osób zapewne jeszcze pamięta pierwsze, wcale nie tak dawne, próby nauczenia komputerów ludzkiego języka. Metaliczna, nieco "żabia" mowa płynąca z głośniczków była od początku do końca wytwarzana przez maszynę. Wtedy komputer mówił naprawdę własnym głosem. Ale mówił niezrozumiale i śmiesznie.

Przełom nastąpił, gdy informatycy nauczyli się "wszczepiać" maszynie głos nagrany przez prawdziwego człowieka. Tak właśnie uczy się mówić Ivona. Nagrane zdania powinny być dobrane tak, by zawarte w nich głoski wyczerpywały wszelkie możliwe kombinacje dźwiękowe w danym języku i program mógł wypowiedzieć dowolny istniejący w nim wyraz. Każdej głosce programiści Ivo Software przypisują kilkadziesiąt parametrów - akcent, głoski i litery występujące przed i po danej głosce itp. Kiedy Ivona dostaje tekst do przeczytania, najpierw stara się go "zrozumieć" - szuka takich głosek, które byłyby najbliższe temu, jak przeczytałby dany tekst człowiek (bo inaczej brzmi np. głoska "pa" w wyrazie "kanapa" a inaczej w słowie "parasol"). Wszystko to musi dziać się w ułamkach sekundy.

Jądro syntezatora tkwi właśnie we właściwym wyborze głosek. Im lepiej program radzi sobie z tym zadaniem, tym bardziej naturalnie umie się wypowiedzieć. Ivona wypada w tej konkurencji dobrze. Ekipa informatyków pomorskiej spółki wygrała nawet ważny branżowy konkurs Blizzard Challenge, pokonując m.in. zespoły Nokii i Toshiby.

Prywatny lektor w komputerze

Gdy kilka lat temu Łukasz Osowski i jego kolega Michał Kaszczuk zakładali swą firmę, miejsce syntezatorów mowy było niemal wyłącznie na rynku rehabilitacyjnym - np. w oprogramowaniu służącym ludziom niewidomym lub słabo widzącym. To głęboka nisza, konkurencja była mała. - Potrafiliśmy stworzyć syntezator lepszy niż istniejące wówczas, więc wiedzieliśmy, że łatwo znajdziemy na tym rynku miejsce - opowiada Osowski - A potem, gdy zrobiliśmy Ivonę, uznaliśmy, że mamy produkt światowej klasy także na szerszy rynek - dla korporacji i klientów indywidualnych.

Spółka ulokowała się w Pomorskim Parku Naukowo-Technologicznym w Gdyni, który udostępnił tanio infrastrukturę i pomógł w promocji. W zeszłym roku Ivo Software zarobiła na czysto ok. 300 tys. zł przy 1,1 mln zł przychodów, a Osowski i Kaszczuk dostali nagrodę w konkursie "Przedsiębiorca roku" (w kategorii "nowy biznes") organizowanym przez Ernst & Young w partnerstwie z "Gazetą Wyborczą".

W tym roku przychody spółki mają przekroczyć 2 mln zł, przy czym rynek rehabilitacyjny daje jej już tylko jedną czwartą tej kwoty. Ivo Software podpisuje kontrakty w branży telekomunikacyjnej czy bankowej - z Ivony korzystają m.in.: Energa, Netia, Santander Bank, mPay, Gadu-Gadu czy Stoen.

Produkt Ivo Software działa też w serwisach internetowych z avatarami - np. na stronie ubezpieczyciela Ergo Hestia użycza głosu wirtualnemu doradcy ubezpieczeniowemu Hubertowi, który próbuje odpowiadać na zadawane pytania. Głos Ivony wykorzystuje też produkująca avatary firma Inteliwise (jej avatary działają m.in. na witrynie LOT-u czy na warszawskiej giełdzie).

Dodatkowo w tym roku gdyńska spółka weszła na rynek konsumencki - za niecałe 100 zł można kupić (w pudełku lub przez internet) program Expressivo, który po zainstalowaniu na komputerze odczytuje zadany mu tekst (pozwala go też zapisać w MP3). Po co komu taki program? - Sami najpierw mieliśmy problem z wymyśleniem zastosowań - uśmiecha się Osowski. Pierwszy pomysł - czytanie napisów do filmów - był raczej słaby. - Znacznie lepsze zastosowania to czytanie książek elektronicznych, szybkie uczenie dzięki jednoczesnemu czytaniu i słuchaniu tekstu oraz nauka języków. Taki program wyposażony w obcojęzyczny głos to w zasadzie prywatny native lector. Od razu wiadomo, jak przeczytać np. jakąś wypowiedź po angielsku. A w takich krajach jak np. Chiny, gdzie jest deficyt lektorów angielskiego, taka pomoc jest nieoceniona - mówi Osowski.

Rynek się rozgrzewa

Na razie w Polsce rynek syntezy głosu to wciąż jeszcze nisza - zaledwie 3-4 mln zł. Rynek światowy to (według różnych szacunków) kilkaset milionów dolarów. Karty na nim rozdaje notowana na Nasdaq amerykańska spółka Nuance - jej udział w rynku ocenia się na ok. 50 proc. W zeszłym roku na syntezie mowy zarobiła na czysto ok. 220 mln dol. Inni duzi gracze na świecie to włoskie Loquendo, belgijska Acapela i szwajcarski SVOX.

Amerykanie z Nuance rywalizują z Ivo także w Polsce - już w 2002 r. zaoferowali syntezator, który mówił w naturalny sposób po polsku. Polskojęzyczny syntezator oferuje także warszawska firma Atlix wyspecjalizowana w tyfloinformatyce, czyli informatyce dla niewidomych. Pierwszy syntezator stworzyła już na przełomie lat 80. i 90. XX wieku i nadal rozwija swą technologię. Właśnie wchodzi na rynek najnowsza wersja jej syntezatora - Speak 3. Jak mówi Janusz Mirowski z Atliksu, jest to jednak produkt głównie dla osób niewidomych. - Rynek rehabilitacyjny ma inne wymagania niż masowy. Niewidomi potrzebują bardzo szybkiego syntezatora, który nie spowalnia pracy komputera. Mniej istotne jest, czy mowa brzmi bardzo naturalnie lub czy głos jest ładny - mówi Mirowski. Badania nad syntezą mowy prowadzi też IBM. Microsoft i Apple szykują się, by w ich systemach operacyjnych (Windows i MacOS X) były zainstalowane bezpłatne syntezatory. Zdaniem Osowskiego jakość mowy Microsoftu odbiega znacznie od czołówki. - Ale tej firmy nie należy lekceważyć ze względu na jej potencjał badawczy i dystrybucyjny - przyznaje.

Branża jest dopiero w przededniu boomu - jak szacuje firma Electronics Industry Market Research, w 2010 r. rynek przetwarzania mowy będzie wart ok. 8 mld dol. Plan minimum dla Ivo Software to zdobycie w 2010 r. 1 proc. światowego rynku. Brzmi skromnie, ale to dokładnie taki sam udział, jaki Apple chce osiągnąć w przyszłym roku ze swoim iPhone'em w rynku komórek. Przy takim udziale Osowski ocenia przychody swojej firmy na ok. 10 mln dol.

Założyciele Ivo Software doszli ostatnio do wniosku, że wzrost spółki finansowany tylko z bieżących przychodów grozi przespaniem szansy. - Jeśli zdecydujemy się na przyspieszenie handlu i marketingu, mamy możliwość szybszego uzyskania znacznie większego udziału w światowym rynku. Ale do tego trzeba pieniędzy - mówi Osowski. Dlatego - choć początkowo odrzucali oferty inwestorów - zmienili zdanie. Chcą inwestora finansowego, który wyłożyłby pieniądze na rozwój spółki, zostawiając jednocześnie kontrolę nad nią w rękach założycieli. W dalszej, dwuletniej perspektywie spółka miałaby wejść na giełdę.

Ambicje wyjścia z niszy rehabilitycyjnej ma także Altlix. Janusz Mirowski: - Na pierwszym miejscu są dla nas klienci niewidomi i niedowidzący. Ale mamy plany stworzenia produktu także na rynek masowy, który coraz szybciej się rozwija.

- Bezdyskusyjnie synteza i rozpoznawanie mowy to dziś gorący temat. Z punktu widzenia inwestorów to bardzo ciekawa branża - mówi Tomasz Czechowicz, szef funduszu MCI inwestującego w branży nowych technologii.

Czekając na emocje

Program Ivona mówi na razie czterema głosami - Jacek i Ewa mówią po polsku, Jennifer - po angielsku a Carmen - po... rumuńsku, głosem znanej dziennikarki z Bukaresztu. Dlaczego Rumunia? - Bo tam nikt jeszcze nie zaoferował syntezatora mowy - tłumaczy Osowski. Pod koniec listopada przybędzie kolejny głos - dla Ivo będzie nagrywał lektor amerykański. Spółka pracuje także nad głosami hiszpańskim i rosyjskim.

- Musimy zdecydować, czy nowy anglojęzyczny głos ma mówić tak, jak czyta się wiadomości w telewizji, czy tak, jak czyta się książkę. To ma duże znaczenie. Np. Jacek mówi tak, jak czyta się krótkie, lekkie opowiadanie. Czasem trudno takim pogodnym głosem podawać np. newsy o jakiejś tragedii - mówi Osowski.

Ale ograniczenia są wciąż duże. Gdy sprawdzając zasób słownictwa programu Ivo Software, zaczynamy z ciekawości wpisywać wulgaryzmy, głośniczki komputerowe przeklinają, owszem, wyraźnie, ale strasznie beznamiętnie i sztywno. Jakoś tak nie po polsku.

- Kiedyś problemem było to, by komputer przemówił zrozumiale. Teraz strategicznym wyzwaniem dla naszej branży jest wyrażanie w mowie emocji, tzw. emotional speech - mówi Osowski. - Na razie nie ma pomysłu, jak to zrobić. Ale to tylko kwestia czasu.




Syntezator mowy czyta za darmo

VO Software, producent jednego z najlepszych na świecie syntezatorów mowy - IVONA, wzbogacił program Expressivo o pakiet bezpłatnych lektur, obejmujących klasyczne pozycje literatury polskiej i światowej. Książki zostały udostępnione w ramach społecznościowego projektu "Wolne Lektury", który prowadzi Fundacja Nowoczesna Polska.

Niekomercyjny projekt

Użytkownicy Expressivo - programu czytającego dowolne teksty ludzkim głosem - mogą teraz swobodnie skorzystać z listy lektur szkolnych. Obejmuje ona kilkadziesiąt tytułów arcydzieł literatury. Dzięki możliwościom Expressivo, w bardzo łatwy sposób można odsłuchać tekst lektury na komputerze lub zapisać go w postaci pliku dźwiękowego na odtwarzaczu MP3 (np. na iPodzie). Każdy Internauta w serwisie expressivo.com może bezpłatnie pobrać plik zawierający teksty lektur. Materiał został przygotowany w ten sposób, że można go w bardzo prosty sposób przenieść do Expressivo, a następnie słuchać wybranych utworów, przetwarzać w pliki dźwiękowe lub kopiować na odtwarzacz MP3.

"Możliwość słuchania książek / / to równocześnie dowód na rosnącą rolę mediów elektronicznych, Internetu i nowoczesnych technologii we współczesnej kulturze" - powiedział Łukasz Osowski, Prezes Zarządu IVO Software Sp. z o.o.


Syntezator mowy o wielu zastosowaniach

Expressivo to program komputerowy dla każdego, który czyta dowolne teksty ludzkim głosem. Expressivo pozwala na słuchanie książek, wiadomości RSS, stron WWW, e-maili - nie tylko na komputerze, ale także na przenośnym odtwarzaczu MP3 na spacerze lub w samochodzie. Program można wykorzystać także jako pomoc przy nauce języka obcego. Jako pierwsza tego typu aplikacja na świecie jest zintegrowany z odtwarzaczami iPod.
Możliwości Expressivo można wypróbować pod adresem www.say.expressivo.com


Wolne Lektury

Projekt "Wolne Lektury" jest koordynowany przez Fundację Nowoczesna Polska. Na portalu internetowym www.wolnelektury.pl umieszczone są teksty lektur szkolnych należących do domeny publicznej, czyli poza rygorami prawa autorskiego. Można je całkiem za darmo i zgodnie z prawem przeglądać on-line, jak również ściągać na twardy dysk komputera. Projekt "Wolne Lektury" jest niekomercyjny i realizowany pro publico bono.


Źródło: Komputer w Firmie

Offline Emilianka

  • User z prawami do pisania
  • Wyjadacz
  • *****
  • Wiadomości: 3124
Ekranowa mowa-syntezatory mowy polskiej
« Odpowiedź #5 dnia: Listopad 13, 2007, 02:57:29 pm »
Program Expressivo:

można wypróbować tutaj:
http://say.expressivo.com/


Strona programu - więcej informacji:
http://www.expressivo.com/pl/

Pobierz demo lub kup program:
http://www.expressivo.com/pl/pobierz/func,select/id,1/

Online Gaga

  • Administrator
  • Rozgadany Weteran
  • *****
  • Wiadomości: 26239
Odp: Ekranowa mowa-syntezatory mowy polskiej
« Odpowiedź #6 dnia: Marzec 17, 2013, 08:10:46 am »

Stworzył komunikator dla przyjaciela, pomógł setce niepełnosprawnych

Roman Biadała za darmo pomaga sparaliżowanym ludziom kontaktować się ze światem. Zaczęło się od tego, że skonstruował dla swojego przyjaciela urządzenie, które wykorzystując ruchy mięśni twarzy, umożliwiało mu pracę z komputerem. Co więcej, własnym sumptem rozpoczął produkcję urządzenia i dziś korzysta już z niego około stu niepełnosprawnych. Materiał "Blisko Ludzi" TTV.


http://www.tvn24.pl/wiadomosci-z-kraju,3/stworzyl-komunikator-dla-przyjaciela-pomogl-setce-niepelnosprawnych,310379.html
Pozdrawiam :))
"Starsza Wiosenna Miotełka"

 

(c) 2003-2017 Team Dar Życia :: nota prawna :: o plikach Cookies :: biuro@darzycia.pl
Polecamy:   Forum o zwierzętach