Akustyka mowy. Transkrypcja i segmentacja

Powrót do: TeachingAnaliza języka i mowy

Zapis ortograficzny a fonetyczny tekstów

Transkrypcja tekstów z zastosowaniem alfabetów fonetycznych IPA i SAMPA. Najważniejsze reguły zamiany zapisu ortograficznego na fonetyczny. Wybrane różnice regionalne w wymowie polskiej.

Międzynarodowy Alfabet Fonetyczny IPA, Hanbook of the IPAlllustration of the IPA: Polish (by Wiktor Jassem)

IPA Chart

Interactive IPA Chart

Alfabet  SAMPASAMPA PL

Strona z klawiaturą IPA: http://ipa.typeit.org/full/

Transkrypcja fonetyczna. Ćwiczenie 1.

1. Proszę wykonać ćw. w docs.google dotyczące transkrypcji SAMPA.

2. Proszę przetranskrybować 10 fraz z zastosowaniem alfabetu IPA. Proszę zaproponować 10 własnych fraz wg przykładów w udostępnionym arkuszu w docs.google i zapisac je zgodnie z regułami wymowy warszawskiej i poznańsko – krakowskiej (zob. np. Zapis fonetyczny, Madelska & Witaszek-Samborska).

Transkrypcja i segmentacja nagrań – wstęp. Ćwiczenie 2.

 1. Proszę uruchomić (w razie potrzeby ściągnąć) program Annotation Pro www.annotationpro.org/downloads
 2. Proszę pobrać plik z nagraniem TUTAJ zapisać go w swoim katalogu.
 3. Otwieramy plik w Annotation Pro (Open)
 4. Proszę zapisać plik z anotacją nadając mu nazwę taką jak nazwa pliku z nagraniem (nadając mu rozszerzenie .ant)
 5. Na pierwszej warstwie anotacji (o nazwie ORTHO) i dla całego nagrania proszę wstawić segmenty (‘insert segment’ lub klawisz Insert na klawiaturze) o długości pojedynczych fraz; granice fraz proszę wyznaczyć na podstawie wstępnej wizualnej oceny sygnału mowy oraz percepcyjnie, na podstawie odsłuchu. Za granicę frazy uznawać będziemy: pauzę akustyczną, pauzę wypełnioną lub granicę prozodyczną wyznaczoną przez: wyraźną zmianę intonacji, iloczasu, natężenia głosu. Proszę zapoznać się z artykułem dotyczącym m.in. podziału na frazy intonacyjne w nagraniach wypowiedzi w j. polskim: TUTAJ.
 6. Wpisać w segmenty tekst wypowiedzi, którym te segmenty odpowiadają (ortograficznie).
 7. Proszę stworzyć nową warstwę w programie, nazwać ją SAMPA i skopiować na nią  2-3 frazy (min. 10 wyrazów co najmniej dwusylabowych) , a następnie zamienić zapis ortograficzny na SAMPA Extended
 8. Proszę stworzyć kolejną warstwę i nazwać ją SOUND. Na tej warstwie proszę posegmentować na głoski te frazy, które znajdują się na warstwie SAMPA. Segmentacji dokonujemy za pomocą wtyczki CLARIN-ALIGN (ANNPRO). Następnie ręcznie dokonujemy korekty segmentacji automatycznej. Uwaga: korekta segmentacji na poziomie głosek obowiązkowo musi odbywać się z wykorzystaniem spektrogramu, na odpowiednim przybliżeniu (zoom’ie), takim który będzie umożliwiał precyzyjną lokalizację granic segmentów głoskowych.
 9. Dodatkowo proszę utworzyć warstwę z komentarzem (COMMENT), na której mogą Państwo (opcjonalnie) dodawać swoje dowolne komentarze.
 10. Ponadto na warstwie COMMENT należy wstawić segment, w którym wpiszą Państwo: swoje imię, nazwisko, kierunek studiów i grupę.
 11. Na koniec proszę dokładnie sprawdzić segmentację (położenie granic) oraz transkrypcję (zgodność z SAMPA Extended).
 12. Sprawdzony plik .ANT proszę przesłać na adres klessa at amu.edu.pl nadając wiadomości następujący tytuł: FONETYKA_Segmentacja_Nazwisko_Imię

Fonetyka_Anotacja_Przykład

Transkrypcja i segmentacja nagrań – specyfikacje.  Ćwiczenie 3

Różnice specyfikacji transkrypcji i segmentacji nagrań w zależności od celu badań.

W ramach ćwiczeń proszę o wykonanie segmentacji nagrań wg specyfikacji znajdujących się w dokumencie Specyfikacje anotacji dialogu udostępnionym dla Państwa na google.docs. Specyfikacje te różnią się poziomem szczegółowości ze względu na dwa różne cele ich wykonania, omówione podczas zajęć:

Cel 1. Transkrypcja nagrań mowy (np. na potrzeby publikacji tekstu dialogu)

Cel 2. Analiza dialogu z uwzględnieniem charakterystyki rozmówców.

W celu wykonania anotacji wg specyfikacji dla Celu 1, proszę wykorzystać plik z fragmentem wywiadu przypisanym Państwu imiennie (zob. plik Segmentacja i transkrypcja przydział plików w google.docs). Natomiast w celu wykonania anotacji wg specyfikacji dla celu 2, proszę skorzystać z plików Dźwięki EMO (niżej; wskazówka: mówczynie wypowiadają te same frazy, można więc częściowo kopiować teksty).

Dźwięki EMO: pobierz tutaj

Materiały: pobierz tutaj

Terminy (sem. letni 2014) – do 31 maja (w razie wątpliwości dotyczących poszczególnych plików, proszę o kontakt mailowy z podaniem nazwy pliku i info o szczegółowej lokalizacji problemowego miejsca, mailowo jestem dostępna także podczas wyjazdów konferencyjnych w dn. 19-30 maja)

Zalecana procedura wykonywania zadań z segmentacji manualnej

Czynność 1: Segmentacja wstępna na podstawie wizualnej analizy spektrogramu (używamy opcji wstaw segment + CTRL Q oraz scroll myszki dla zoom in/out)

Czynność 2: Zbliżamy się (zoom in)  i takze na podstawie wizualnej analizy dokonujemy poprawek segmentacji (przesuwamy granice/segmenty, tak żeby dokładniej oddzielały poszczegolne fragmenty (frazy, głoski) w nagraniu)

Czynność 3: Dokonujemy ostatecznych poprawek na podstawie odsłuchu i dalszej analizy spektrogramu

Automatyzacja segmentacji i transkrypcji

Narzędzia:

 • Mowa CLARIN-PL (online) tutaj
 • WEBMaus (online) tutaj
 • SPPAS (do pobrania) tutaj

Slajdy: tutaj

Do posłuchania/przeczytania

Cz. 1

Zobacz: Materiały dla języków Taa oraz ǂAkhoe Haiǁom na interaktywnej mapie na stronie: languagesindanger.eu

Silbo Gomero – język gwizdany (Wyspy Kanaryjskie): https://www.youtube.com/watch?v=PgEmSb0cKBg

Illustrations of the IPA – tutaj, nagrania wybrane, tutaj.

Jassem, W. 2003. Illustrations of the IPA: Polish. Journal of the International Phonetic Association 33(1): 103-107.

Madelska, L, Witaszek-Samborska, M. Zapis fonetyczny. Zbiór ćwiczeń, str. 17-21 (alfabety, ich opisy, ćw. 1), albo:

Ostaszewska, D, Tambor, J. Fonetyka i fonologia języka polskiego (str. 18-22).

Jassem, W. Podstawy fonetyki akustycznej, str. 139-145 (o transkrypcji fonetycznej)

Jassem, W. Acoustic-phonetic variability of Polish vowels. Archives of Acoustics, 17(2), 217-233.

Karpiński, M.  Dźwięki mowy, Book of Knowledge of Languages in Danger (PL).

Gibbon, D. Wskazówki dotyczące nagrywania dźwięków mowy.

Cz. 2

Dukiewicz, L., Sawicka, I. Fonetyka i fonologia, str. 49-95 (od rozdziału: Istota i struktura fal głosowych do rozdz. Częstość występowania elementów mowy).

Klessa, K., Annotation Pro, oraz krótka pomoc programu:  Quick Start tutaj (linki prowadzą do wer. angielskiej on-line, dokument PDF jest w j. polskim), prezentacja wprowadzająca – tutaj.

Machac, P., Skarnitzl, R. 2009. Principles of Phonetic Segmentation (dla chętnych, fragm. tutaj)

Do zad. z anotacją dialogu (opcjonalne, zależnie od kursu), wywiad radiowy tutaj albo na stronie głównej inne-jezyki.amu.edu.pl

Proszę zapoznać się z systemem głoskowym języka wilamowskiego tutaj: http://inne-jezyki.amu.edu.pl/Frontend/Language/Details/10/Typology

Opracowanie dotyczące samogłosek w j. wilamowskim: http://inne-jezyki.amu.edu.pl/Frontend/Content/About/Wilamowski-monoftongi_PL.pdf

Materiały dotyczące specyfikacji anotacji nagrań: tutaj

Cz. 3:

O czcionkach IPA vs. Unicode:

http://www.phon.ucl.ac.uk/home/wells/ipa-unicode.htm

tab

Comments are closed.