Powrót do: Teaching – Analiza języka i mowy
Zapis ortograficzny a fonetyczny tekstów
Transkrypcja tekstów z zastosowaniem alfabetów fonetycznych IPA i SAMPA. Najważniejsze reguły zamiany zapisu ortograficznego na fonetyczny. Wybrane różnice regionalne w wymowie polskiej.
Międzynarodowy Alfabet Fonetyczny IPA, Hanbook of the IPA, lllustration of the IPA: Polish (by Wiktor Jassem)
Strona z klawiaturą IPA: http://ipa.typeit.org/full/
Transkrypcja fonetyczna. Ćwiczenie 1.
1. Proszę wykonać ćw. w docs.google dotyczące transkrypcji SAMPA.
2. Proszę przetranskrybować 10 fraz z zastosowaniem alfabetu IPA. Proszę zaproponować 10 własnych fraz wg przykładów w udostępnionym arkuszu w docs.google i zapisac je zgodnie z regułami wymowy warszawskiej i poznańsko – krakowskiej (zob. np. Zapis fonetyczny, Madelska & Witaszek-Samborska).
Transkrypcja i segmentacja nagrań – wstęp. Ćwiczenie 2.
- Proszę uruchomić (w razie potrzeby ściągnąć) program Annotation Pro www.annotationpro.org/downloads
- Proszę pobrać plik z nagraniem TUTAJ zapisać go w swoim katalogu.
- Otwieramy plik w Annotation Pro (Open)
- Proszę zapisać plik z anotacją nadając mu nazwę taką jak nazwa pliku z nagraniem (nadając mu rozszerzenie .ant)
- Na pierwszej warstwie anotacji (o nazwie ORTHO) i dla całego nagrania proszę wstawić segmenty (‘insert segment’ lub klawisz Insert na klawiaturze) o długości pojedynczych fraz; granice fraz proszę wyznaczyć na podstawie wstępnej wizualnej oceny sygnału mowy oraz percepcyjnie, na podstawie odsłuchu. Za granicę frazy uznawać będziemy: pauzę akustyczną, pauzę wypełnioną lub granicę prozodyczną wyznaczoną przez: wyraźną zmianę intonacji, iloczasu, natężenia głosu. Proszę zapoznać się z artykułem dotyczącym m.in. podziału na frazy intonacyjne w nagraniach wypowiedzi w j. polskim: TUTAJ.
- Wpisać w segmenty tekst wypowiedzi, którym te segmenty odpowiadają (ortograficznie).
- Proszę stworzyć nową warstwę w programie, nazwać ją SAMPA i skopiować na nią 2-3 frazy (min. 10 wyrazów co najmniej dwusylabowych) , a następnie zamienić zapis ortograficzny na SAMPA Extended
- Proszę stworzyć kolejną warstwę i nazwać ją SOUND. Na tej warstwie proszę posegmentować na głoski te frazy, które znajdują się na warstwie SAMPA. Segmentacji dokonujemy za pomocą wtyczki CLARIN-ALIGN (ANNPRO). Następnie ręcznie dokonujemy korekty segmentacji automatycznej. Uwaga: korekta segmentacji na poziomie głosek obowiązkowo musi odbywać się z wykorzystaniem spektrogramu, na odpowiednim przybliżeniu (zoom’ie), takim który będzie umożliwiał precyzyjną lokalizację granic segmentów głoskowych.
- Dodatkowo proszę utworzyć warstwę z komentarzem (COMMENT), na której mogą Państwo (opcjonalnie) dodawać swoje dowolne komentarze.
- Ponadto na warstwie COMMENT należy wstawić segment, w którym wpiszą Państwo: swoje imię, nazwisko, kierunek studiów i grupę.
- Na koniec proszę dokładnie sprawdzić segmentację (położenie granic) oraz transkrypcję (zgodność z SAMPA Extended).
- Sprawdzony plik .ANT proszę przesłać na adres klessa at amu.edu.pl nadając wiadomości następujący tytuł: FONETYKA_Segmentacja_Nazwisko_Imię
Transkrypcja i segmentacja nagrań – specyfikacje. Ćwiczenie 3
Różnice specyfikacji transkrypcji i segmentacji nagrań w zależności od celu badań.
W ramach ćwiczeń proszę o wykonanie segmentacji nagrań wg specyfikacji znajdujących się w dokumencie Specyfikacje anotacji dialogu udostępnionym dla Państwa na google.docs. Specyfikacje te różnią się poziomem szczegółowości ze względu na dwa różne cele ich wykonania, omówione podczas zajęć:
Cel 1. Transkrypcja nagrań mowy (np. na potrzeby publikacji tekstu dialogu)
Cel 2. Analiza dialogu z uwzględnieniem charakterystyki rozmówców.
W celu wykonania anotacji wg specyfikacji dla Celu 1, proszę wykorzystać plik z fragmentem wywiadu przypisanym Państwu imiennie (zob. plik Segmentacja i transkrypcja przydział plików w google.docs). Natomiast w celu wykonania anotacji wg specyfikacji dla celu 2, proszę skorzystać z plików Dźwięki EMO (niżej; wskazówka: mówczynie wypowiadają te same frazy, można więc częściowo kopiować teksty).
Dźwięki EMO: pobierz tutaj
Materiały: pobierz tutaj
Terminy (sem. letni 2014) – do 31 maja (w razie wątpliwości dotyczących poszczególnych plików, proszę o kontakt mailowy z podaniem nazwy pliku i info o szczegółowej lokalizacji problemowego miejsca, mailowo jestem dostępna także podczas wyjazdów konferencyjnych w dn. 19-30 maja)
Zalecana procedura wykonywania zadań z segmentacji manualnej
Czynność 1: Segmentacja wstępna na podstawie wizualnej analizy spektrogramu (używamy opcji wstaw segment + CTRL Q oraz scroll myszki dla zoom in/out)
Czynność 2: Zbliżamy się (zoom in) i takze na podstawie wizualnej analizy dokonujemy poprawek segmentacji (przesuwamy granice/segmenty, tak żeby dokładniej oddzielały poszczegolne fragmenty (frazy, głoski) w nagraniu)
Czynność 3: Dokonujemy ostatecznych poprawek na podstawie odsłuchu i dalszej analizy spektrogramu
Automatyzacja segmentacji i transkrypcji
Narzędzia:
Slajdy: tutaj
Do posłuchania/przeczytania
Cz. 1
Zobacz: Materiały dla języków Taa oraz ǂAkhoe Haiǁom na interaktywnej mapie na stronie: languagesindanger.eu
Silbo Gomero – język gwizdany (Wyspy Kanaryjskie): https://www.youtube.com/watch?v=PgEmSb0cKBg
Illustrations of the IPA – tutaj, nagrania wybrane, tutaj.
Jassem, W. 2003. Illustrations of the IPA: Polish. Journal of the International Phonetic Association 33(1): 103-107.
Madelska, L, Witaszek-Samborska, M. Zapis fonetyczny. Zbiór ćwiczeń, str. 17-21 (alfabety, ich opisy, ćw. 1), albo:
Ostaszewska, D, Tambor, J. Fonetyka i fonologia języka polskiego (str. 18-22).
Jassem, W. Podstawy fonetyki akustycznej, str. 139-145 (o transkrypcji fonetycznej)
Jassem, W. Acoustic-phonetic variability of Polish vowels. Archives of Acoustics, 17(2), 217-233.
Karpiński, M. Dźwięki mowy, Book of Knowledge of Languages in Danger (PL).
Gibbon, D. Wskazówki dotyczące nagrywania dźwięków mowy.
Cz. 2
Dukiewicz, L., Sawicka, I. Fonetyka i fonologia, str. 49-95 (od rozdziału: Istota i struktura fal głosowych do rozdz. Częstość występowania elementów mowy).
Klessa, K., Annotation Pro, oraz krótka pomoc programu: Quick Start tutaj (linki prowadzą do wer. angielskiej on-line, dokument PDF jest w j. polskim), prezentacja wprowadzająca – tutaj.
Machac, P., Skarnitzl, R. 2009. Principles of Phonetic Segmentation (dla chętnych, fragm. tutaj)
Do zad. z anotacją dialogu (opcjonalne, zależnie od kursu), wywiad radiowy tutaj albo na stronie głównej inne-jezyki.amu.edu.pl
Proszę zapoznać się z systemem głoskowym języka wilamowskiego tutaj: http://inne-jezyki.amu.edu.pl/Frontend/Language/Details/10/Typology
Opracowanie dotyczące samogłosek w j. wilamowskim: http://inne-jezyki.amu.edu.pl/Frontend/Content/About/Wilamowski-monoftongi_PL.pdf
Materiały dotyczące specyfikacji anotacji nagrań: tutaj
Cz. 3:
O czcionkach IPA vs. Unicode: