Powrót do: Analiza Języka i Mowy
Melodia nuklearna wypowiedzi w j. polskim
1. Wyszukiwanie informacji w korpusie PoInt – ćwiczenia z użyciem różnych możliwych kryteriów wyszukiwania
2. Proszę wyszukać w korpusie PoInt pliki o wskazanych opisach melodii nuklearnej: LM, ML, MH, HM-L, LC
3. Na podstawie wyszukanych plików wg kryteriów z punktu 2 wyżej, proszę stworzyć krótki opis zastosowanego w korpusie PoInt systemu anotacji melodii nuklearnej (ćwiczenie można wykonać w parach).
4. Proszę uruchomić program Praat i otworzyć w nim plik z nagraniem własnego głosu “takaladna.wav”. Otwieramy plik wybierając opcję ‘Read from File…’ z menu ‘Open’. Aby wyświetlić obraz dźwięku wybieramy ‘View&Edit’, tutaj możemy odsłuchać plik (odtwarzanie z klawiatury – przycisk Tab, zoom in – CTRL+i, zoom out, CTRL+o).
5. W programie Praat proszę stworzyć anotację prozodyczną nagrania “takaladna.wav” zgodnie z ww. systemem opisu korpusu PoInt. Następnie proszę w analogiczny sposób anotować trzy kolejne nagrania “ziemniaki.wav”. Należy stworzyć trzy warstwy anotacji: a) ortograficzna (wyrazowa, segmentujemy sygnał na wyrazy zapisujemy wyrazy w zapisie ortograficznym); b) fonetyczna (segmentujemy sygnał na głoski, tylko dla wyrazów, gdzie występuje melodia nuklearna); c) prozodyczna (oznaczenie melodii nuklearnej wg systemu w bazie PoInt)
Transkrypcja i anotacja w Praat:
Klikamy na liście na nazwę pliku, który chcemy anotować, wybieramy ‘Annotate’, a następnie definiujemy warstwy anotacji (w naszym przypadku: word, segment, intonation).
Następnie wybieramy na liście plików jednocześnie nazwę pliku z dźwiękiem oraz textGrid i wybieramy ‘View&Edit’ po prawej stronie. Wyświetla się nam okno, w którym widoczny jest obraz dźwięku i 2 panele transkrypcji i anotacji:
Dodatkową pomocą przy decyzji o oznaczeniu melodii nuklearnej może być opcja Hum (ekstrakcja melodii podstawowej z próbki mowy) w programie Praat. (Zaznaczamy dźwięk na liście, wybieramy opcję ‘To Manipulation’, a następnie zaznaczamy uzyskany wynik i możemy wybrać ‘Extract pulses’. Po zaznaczeniu uzyskanego pliku możemy wybrać ‘Play’ – ‘pulse train’ lub właśnie ‘hum’)
6. Proszę zapisać wyniki anotacji plików w postaci graficznej (wykorzystać opcje Draw… w Praacie)
7. Proszę podzielić na frazy intonacyjne i anotować melodię nuklearną w każdej frazie dla wypowiedzi: Phrasing. W tym celu proszę stworzyć trzy warstwy anotacji, jedną dla transkrypcji w SAMPA drugą dla melodii i nazwać je odpowiednio: frazy, intonacja, pozajezykowe, komentarz. Na warstwach frazy, intonacja dzielimy sygnał na frazy intonacyjne, można zdublować segmentację (na warstwie frazy wpisujemy transkrypcję danej frazy, na warstwie intonacja – oznaczamy melodię). Dodatkowo na warstwie pozajęzykowe zaznaczamy słyszalne zjawiska w wypowiedzi inne niż zwykły tekst. Na warstwie komentarz można wpisać krótki komentarz, jeśli mamy jakieś uwagi/wątpliwości.
8. Proszę wygenerować tabelę wyników dla ćwiczenia z punktu 7 (Opcja “Down To Table…”).
Materiały:
PoInt – Informacja o projekcie i prawach autorskich
Interfaces Prosodiques 2003 – Proceedings
Evidence from PoInt – Polish semi-spontaneous and read speech
ToBI Intonation Transcription Summary
Przeglądarka PoInt
Speecon – raport dot. baz danych
http://katarzyna.klessa.pl/wp-content/uploads/2013/04/Emo.zip