Επεξεργασία Ομιλίας και Φυσικής Γλώσσας
Γεώργιος Κουρουπέτρογλου
Το μάθημα έχει σκοπό τη θεωρητική και πρακτική εξοικείωση του φοιτητή με τις βασικές αρχές και μεθόδους ψηφιακής ανάλυσης, σύνθεσης/παραγωγής και αυτόματης αναγνώρισης ομιλίας, που χρησιμοποιούνται κατά την Επικοινωνία Ανθρώπου–Μηχανής με Ομιλία, τα Διαλογικά Συστήματα Αλληλεπίδρασης με Ομιλία, τους Φωνητικούς Browsers και τα Voice Portals, τα ενσωματωμένα συστήματα με φωνή και τα βοηθήματα Ατόμων με Αναπηρία.
Λέξεις-κλειδιά: ψηφιακή ανάλυση σημάτων ομιλίας, σύνθεση οιμιλίας, αναγνώριση ομιλίας, μετατροπή κειμένου σε ομιλία
ΛιγότεραΤο μάθημα έχει σκοπό τη θεωρητική και πρακτική εξοικείωση του φοιτητή με τις βασικές αρχές και μεθόδους ψηφιακής ανάλυσης, σύνθεσης/παραγωγής και αυτόματης αναγνώρισης ομιλίας, που χρησιμοποιούνται κατά την Επικοινωνία Ανθρώπου–Μηχανής με Ομιλία, τα Διαλογικά Συστήματα Αλληλεπίδρασης με Ομιλία, τους Φωνητικούς Browsers και τα Voice Portals, τα ενσωματωμένα συστήματα με φωνή και τα βοηθήματα Ατόμων με Αναπηρία.
Λέξεις-κλειδιά: ψηφιακή ανάλυση σημάτων ομιλίας, σύνθεση οιμιλίας, αναγνώριση ομιλίας, μετατροπή κειμένου σε ομιλία
Το μάθημα έχει σκοπό τη θεωρητική και πρακτική εξοικείωση του φοιτητή με τις βασικές αρχές και μεθόδους ψηφιακής ανάλυσης, σύνθεσης/παραγωγής και αυτόματης αναγνώρισης ομιλίας, που χρησιμοποιούνται κατά την Επικοινωνία Ανθρώπου–Μηχανής με Ομιλία, τα Διαλογικά Συστήματα Αλληλεπίδρασης με Ομιλία, τους Φωνητικούς Browsers και τα Voice Portals, τα ενσωματωμένα συστήματα με φωνή και τα βοηθήματα Ατόμων με Αναπηρία.
Λέξεις-κλειδιά: ψηφιακή ανάλυση σημάτων ομιλίας, σύνθεση οιμιλίας, αναγνώριση ομιλίας, μετατροπή κειμένου σε ομιλία
Περίγραμμα
Περιεχόμενο μαθήματος
Βασικά χαρακτηριστικά σημάτων ομιλίας. Μηχανισμοί και πρότυπα παραγωγής ομιλίας. Ακοή και αντίληψη ομιλίας. Μέθοδοι ψηφιακής ανάλυσης σημάτων ομιλίας. Η μέθοδος της γραμμικής πρόβλεψης. Ψηφιακή κωδικοποίηση ομιλίας. Μέθοδοι σύνθεσης ομιλίας. Μετατροπή κειμένου σε ομιλία. Μέθοδοι αναγνώρισης ομιλίας. Η ομιλία στην επικοινωνία ανθρώπου-μηχανής. Εφαρμογές στα συστήματα πληροφορικής και επικοινωνιών.
Μαθησιακοί στόχοι
Ο στόχος του μαθήματος είναι η θεωρητική και πρακτική εξοικείωση του φοιτητή με τις βασικές αρχές και μεθόδους ψηφιακής ανάλυσης, σύνθεσης/παραγωγής και αυτόματης αναγνώρισης ομιλίας, που χρησιμοποιούνται κατά την Επικοινωνία Ανθρώπου–Μηχανής με Ομιλία, τα Διαλογικά Συστήματα Αλληλεπίδρασης με Ομιλία, τους Φωνητικούς Browsers και τα Voice Portals, τα ενσωματωμένα συστήματα με φωνή και τα βοηθήματα Ατόμων με Αναπηρία.
Βιβλιογραφία
- Lawrence R. Rabiner, Ronald W. Schafer «Introduction to Digital Speech Processing» Now Publishers Inc, 2007
- X. Huang, A. Acero, H.-W. Hon «Spoken Language Processing», Prentice-Hall, Englewood Cliffs, 2001
- L. Rabiner “Ψηφιακή Επεξεργασία Φωνής: Θεωρία και Εφαρμογές”, Εκδόσεις Πασχαλίδης, 2011
- G. Fant “Text, Speech Acoustics and Phonetics”, Springer 2005
Software Tools
- Adobe Audition [download link]
- Praat [download link]
- Speech Files System [download link]
- http://speech.di.uoa.gr:80/S_download.htm
Ιστοσελίδα εργαστηρίου φωνής: http://speech.di.uoa.gr/
Μέθοδοι διδασκαλίας
Διδασκαλία καθ΄ έδρας και συμπληρωματική-ενισχυτική εκπαίδευση μέσω ασύγχρονης πλατφόρμα.
Εργαστήριο.
Προαπαιτούμενα
Σήματα και Συστήματα (Κ11) - http://eclass.uoa.gr/courses/D94/
Διδάσκοντες
Ομάδα στόχος
Προπτυχιακοί φοιτητές του τμήματος Πληροφορικής και τηλεπικοινωνιών και πτυχιούχοι του Tμήματος.
Προτεινόμενα συγγράμματα
Γ. Κουρουπέτρογλου «Μαθήματα Επεξεργασίας Ομιλίας», Πανεπιστήμιο Αθηνών, 2005.
Βασικά χαρακτηριστικά σημάτων ομιλίας. Μηχανισμοί και πρότυπα παραγωγής ομιλίας. Ακοή και αντίληψη ομιλίας. Μέθοδοι ψηφιακής ανάλυσης σημάτων ομιλίας. Η μέθοδος της γραμμικής πρόβλεψης. Ψηφιακή κωδικοποίηση ομιλίας. Μέθοδοι σύνθεσης ομιλίας. Μετατροπή κειμένου σε ομιλία. Μέθοδοι αναγνώρισης ομιλίας. Η ομιλία στην επικοινωνία ανθρώπου-μηχανής. Εφαρμογές στα συστήματα πληροφορικής και επικοινωνιών.
Ο στόχος του μαθήματος είναι η θεωρητική και πρακτική εξοικείωση του φοιτητή με τις βασικές αρχές και μεθόδους ψηφιακής ανάλυσης, σύνθεσης/παραγωγής και αυτόματης αναγνώρισης ομιλίας, που χρησιμοποιούνται κατά την Επικοινωνία Ανθρώπου–Μηχανής με Ομιλία, τα Διαλογικά Συστήματα Αλληλεπίδρασης με Ομιλία, τους Φωνητικούς Browsers και τα Voice Portals, τα ενσωματωμένα συστήματα με φωνή και τα βοηθήματα Ατόμων με Αναπηρία.
- Lawrence R. Rabiner, Ronald W. Schafer «Introduction to Digital Speech Processing» Now Publishers Inc, 2007
- X. Huang, A. Acero, H.-W. Hon «Spoken Language Processing», Prentice-Hall, Englewood Cliffs, 2001
- L. Rabiner “Ψηφιακή Επεξεργασία Φωνής: Θεωρία και Εφαρμογές”, Εκδόσεις Πασχαλίδης, 2011
- G. Fant “Text, Speech Acoustics and Phonetics”, Springer 2005
Software Tools
- Adobe Audition [download link]
- Praat [download link]
- Speech Files System [download link]
- http://speech.di.uoa.gr:80/S_download.htm
Ιστοσελίδα εργαστηρίου φωνής: http://speech.di.uoa.gr/
Διδασκαλία καθ΄ έδρας και συμπληρωματική-ενισχυτική εκπαίδευση μέσω ασύγχρονης πλατφόρμα.
Εργαστήριο.
Σήματα και Συστήματα (Κ11) - http://eclass.uoa.gr/courses/D94/
Προπτυχιακοί φοιτητές του τμήματος Πληροφορικής και τηλεπικοινωνιών και πτυχιούχοι του Tμήματος.
Γ. Κουρουπέτρογλου «Μαθήματα Επεξεργασίας Ομιλίας», Πανεπιστήμιο Αθηνών, 2005.
Τρόπος επικοινωνίας με ομιλία μεταξύ ανθρώπων. Σημαντικότητα επικοινωνίας με ομιλία. Εφαρμογές επεξεργασίας ομιλίας.
Λέξεις κλειδιά: επικοινωνία με ομιλία, εφαρμογές επεξεργασίας ομιλίας
Ανάλυση των βασικών χαρακτηριστικών του σήματος ομιλίας.
Λέξεις κλειδιά: Ανάλυση σήματος ομιλίας
Από το φυσιολογικό μοντέλο παραγωγής ομιλίας στο ηλεκτρονικό αντίστοιχο.
Λέξεις κλειδιά: φυσιολογικό μοντέλο παραγωγής ομιλίας, ηλεκτρονικό μοντέλο παραγωγής ομιλίας
Μέθοδοι ψηφιακής επεξεργασίας σημάτων ομιλίας στο χρονικό και φασματικό πεδίο.
Λέξεις κλειδιά: ψηφιακή επεξεργασία ομιλίας
Μεθοδολογία ανάλυσης σημάτων ομιλίας μέσω Κωδικοποίησης Γραμμικής Πρόβλεψης (Linear Prediction Coding-LPC)
Λέξεις κλειδιά: κωδικοποίηση γραμμικής πρόβλεψης
Μέθοδοι σύνθεσης ομιλίας και συστήματα Μετατροπής κειμένου σε ομιλία.
Λέξεις κλειδιά: σύνθεση ομιλίας, μετατροπή κειμένου σε ομιλία
Ψηφιακές μέθοδοι αυτόματης αναγνώρισης ομιλίας.
Λέξεις κλειδιά: αναγνώριση ομιλίας, Hidden Markov Models, τεχνητά νευρωνικά δίκτυα
Ανοικτό Ακαδ. Μάθημα
Αρ. Επισκέψεων : 0
Αρ. Προβολών : 0
Ημερολόγιο
Ανακοινώσεις
- - Δεν υπάρχουν ανακοινώσεις -