| 12, 13, 16, 17 i 18 de juliol del 2001 | ||
| Director: | Dr. Marsal
Gavaldà School of Computer Science Carnegie Mellon University | |
| Secretari | Dr. Toni Badia
Institut Universitari de Lingüística Aplicada Universitat Pompeu Fabra | |
|
Aprofundint en el contingut del curs de l’any passat sobre tecnologies de la llengua, ens centrem enguany en el tractament i reconeixement de la parla humana, exemple excel·lent de la tercera llei de la tecnologia d’Arthur Clarke (Any sufficiently advanced technology is indistinguishable from magic), i és que sembla realment màgic que un ordinador sigui capaç de transcriure el que hom diu, és a dir, de transformar el senyal acústic de la veu en la seqüència de mots que formen el text escrit corresponent. Aquest curs, per mitjà de conferències i taules rodones a càrrec d’investigadors de renom mundial i de demostracions tant de prototipus de recerca com de productes comercials, ensenyarà detalladament la màgia que fa possible una tecnologia tan espectacular, des dels algorismes emprats en el processament digital del senyal fins a les aplicacions més futuristes del reconeixement de la parla, sense oblidar la necessària reflexió sobre les implicacions sociolingüístiques que aquesta tecnologia comporta. | ||
| Lloc de realització: | Centre de Cultura
Contemporània de Barcelona Montalegre, 5 08001 Barcelona | |
| Patrocinador: |
Regidoria de Ciutat del Coneixement Ajuntament de Barcelona | |
|
PROGRAMA | ||
| Dijous 12 de juliol | ||
| 9.30 - 13.30 h | Producció, percepció i codificació de
la parla Climent Nadeu Professor del Departament de Teoria i Senyal i Comunicacions Universitat Politècnica de Catalunya | |
| Continguts: Producció i percepció de la parla Fisiologia Fonètica | ||
| Representació
Domini temporal Domini de freqüència Lectura d’espectres | ||
| Processament
digital del senyal Sampling | ||
| Codificació Linear predictive coding | ||
| Feature extraction Anàlisi de Fourier Vector quantization | ||
| DIvendres 13 de juliol | ||
| 9.30 - 13.30 h | Descodificació del senyal
acústic Monika Woszczyna* Senior Research Scientist, Interactive Systems Adjunct Professor Language Technologies Institute Carnegie Mellon University | |
| Continguts: Models acústics Cadenes de Markov (HMM) | ||
| Models del
llenguatge Models estocàstics N-grams Gramàtiques | ||
|
Algorismes de cerca
| ||
| Dilluns 16 de juliol | ||
| 9.30 - 11.15 h | Noves aplicacions del tractament de la
veu Xuedong Huang* General Manager Microsoft Speech.Net | |
| Continguts: Portals de veu Embedded systems Cerca per melodia | ||
| Estandardització
VoiceXML Java Speech API Microsoft speech.net | ||
| 11.45 - 13.30 h | Taula rodona Implicacions socials del tractament infor màtic de la parla Xuedong Huang* Joaquim Llisterri Professor de Lingüística Universitat Autònoma de Barcelona Santiago Aguilera Professor del Departament d’Enginyeria Electrònica Universidad Politécnica de Madrid | |
| Dimarts 17 de juliol | ||
| 9.30 - 13.30 h |
Sistemes complets | |
| Continguts: Característiques dels sistemes de reconeixement de la parla Dependent vs. independent del parlant Reconeixement de mots isolats vs. continus vs. espontanis Qualitat de so necessària | ||
| Característiques
de la tasca Vocabulari petit vs. mitjà vs. gran Perplexitat Llengua oral i espontània | ||
| Ús
final Transcripció Traducció automàtica Comandament i control Integració amb el back-end Sistemes de diàleg | ||
| Dimecres 18 de juliol | ||
| 9.00 h |
Sessió oberta al públic | |
| * Traducció simultània | ||