Tecnologies de la llengua: Tractament de la parla

12, 13, 16, 17 i 18 de juliol del 2001
Director: Dr. Marsal Gavaldà
School of Computer Science
Carnegie Mellon University
Secretari Dr. Toni Badia
Institut Universitari de Lingüística Aplicada
Universitat Pompeu Fabra
 

Aprofundint en el contingut del curs de l’any passat sobre tecnologies de la llengua, ens centrem enguany en el tractament i reconeixement de la parla humana, exemple excel·lent de la tercera llei de la tecnologia d’Arthur Clarke (Any sufficiently advanced technology is indistinguishable from magic), i és que sembla realment màgic que un ordinador sigui capaç de transcriure el que hom diu, és a dir, de transformar el senyal acústic de la veu en la seqüència de mots que formen el text escrit corresponent. Aquest curs, per mitjà de conferències i taules rodones a càrrec d’investigadors de renom mundial i de demostracions tant de prototipus de recerca com de productes comercials, ensenyarà detalladament la màgia que fa possible una tecnologia tan espectacular, des dels algorismes emprats en el processament digital del senyal fins a les aplicacions més futuristes del reconeixement de la parla, sense oblidar la necessària reflexió sobre les implicacions sociolingüístiques que aquesta tecnologia comporta.

   
Lloc de realització: Centre de Cultura Contemporània de Barcelona
Montalegre, 5
08001 Barcelona
Patrocinador:

Regidoria de Ciutat del Coneixement Ajuntament de Barcelona

 

PROGRAMA

Dijous 12 de juliol
9.30 - 13.30 h Producció, percepció i codificació de la parla
Climent Nadeu
Professor del Departament de Teoria i Senyal i Comunicacions
Universitat Politècnica de Catalunya
  Continguts:
Producció i percepció de la parla
Fisiologia
Fonètica
  Representació
Domini temporal
Domini de freqüència
Lectura d’espectres
  Processament digital del senyal
Sampling
  Codificació
Linear predictive coding
  Feature extraction
Anàlisi de Fourier
Vector quantization
   
DIvendres 13 de juliol
9.30 - 13.30 h Descodificació del senyal acústic
Monika Woszczyna*
Senior Research Scientist, Interactive Systems
Adjunct Professor
Language Technologies Institute
Carnegie Mellon University
  Continguts:
Models acústics
Cadenes de Markov (HMM)
  Models del llenguatge
Models estocàstics
N-grams
Gramàtiques
 

Algorismes de cerca
Dynamic time warping
Viterbi

Dilluns 16 de juliol
9.30 - 11.15 h Noves aplicacions del tractament de la veu
Xuedong Huang*
General Manager
Microsoft Speech.Net
  Continguts:
Portals de veu
Embedded systems
Cerca per melodia

  Estandardització
VoiceXML
Java Speech API
Microsoft speech.net
11.45 - 13.30 h Taula rodona
Implicacions socials del tractament infor màtic de la parla
Xuedong Huang*
Joaquim Llisterri
Professor de Lingüística
Universitat Autònoma de Barcelona
Santiago Aguilera
Professor del Departament d’Enginyeria Electrònica
Universidad Politécnica de Madrid
   
Dimarts 17 de juliol
9.30 - 13.30 h

Sistemes complets
Alex Waibel*
Director, Interactive Systems Labs
Carnegie Mellon University
i Universität Karlsruhe

  Continguts:
Característiques dels sistemes de reconeixement de la parla
Dependent vs. independent del parlant
Reconeixement de mots isolats vs. continus vs. espontanis
Qualitat de so necessària
  Característiques de la tasca
Vocabulari petit vs. mitjà vs. gran
Perplexitat
Llengua oral i espontània
  Ús final
Transcripció
Traducció automàtica
Comandament i control
Integració amb el back-end
Sistemes de diàleg
   
Dimecres 18 de juliol
9.00 h

Sessió oberta al públic
Sessió conjunta amb el curs «Evolució, llenguatge i coneixement»
Terrence Deacon*
Harvard Medical School, Boston
Roger Fouts*
Central Washington University, Washington
Marsal Gavaldà
School of Computer Science
Carnegie Mellon University

  * Traducció simultània