Pe măsură ce tehnologiile inteligente și adaptive au devenit din ce în ce mai integrate în viața personală, este de așteptat ca roboții asistivi să devină adevărați parteneri și companioni ai utilizatorilor umani pe care îi servesc. Totuși, roboții de uz general nu sunt încă gata, dar observăm tehnologii emergente în viitorul apropiat care să ajute oamenii. Una din funcționalitățile fundamentale pentru acceptarea unui robot asistiv este capacitatea sa comunicațională. Domotica modernă presupune, de asemenea, interacțiunea naturală prin comenzi în limbaj natural.

Pentru limba română, interacțiunea prin voce este încă o mare provocare, cu câteva experimente încurajatoare, dar limitate. Contextul comunicațional de interes pentru acest proiect este dialogul situațional, care presupune raportarea la realitatea imediată. Una din cele mai eficiente metodologii de proiectare a componentei de comunicare situațională în limbaj natural se bazează pe scenarii pentru micro-lumi. Marele avantaj al acestei abordări constă în posibilitățile de a anticipa intențiile partenerului uman, conținutul cel mai probabil al unei cereri sau comenzi, precum și de a formula solicitări inteligente de clarificare în condițiile insuficienței cunoștințelor pentru prelucrarea mesajului transmis.

OBIECTIVELE

Scopul proiectului ROBIN-DIALOG presupune dezvoltarea unei serii de scenarii pentru câteva micro-lumi și tehnologia de prelucrare a limbii române pentru dialoguri situaționale în aceste micro-lumi. Această tehnologie va fi validată pe scenariile și micro-lumile cercetate, dar va fi dezvoltată în așa fel încât să poată fi aplicată cu ușurință și pe alte scenarii și/sau micro-lumi. Caracterul de generalitate va fi asigurat de metodele de învățare automată de tip ”deep learning” și de specificarea resurselor (e.g. baze de cunoștințe) în limbaje standard (e.g. XML/RDF) care vor asigura funcționarea sistemului în orice micro-lume și/sau scenariu, atâta timp cât datele de antrenare și resursele specifice vor fi disponibile pentru acestea.n dezvoltarea de metode de vedere computaţională care să rezolve o gamă mai largă şi mai sofisticată de sarcini de asistenţă în pilotaj, realizarea unor module inteligente pentru „Hands-off driving” și „Automated driving” și un sistem prototip care va fi testat pe un autovehicul electric semi-autonom pus la dispoziția consorțiului de compania PRIME Motors Industry,  pe durata derulării proiectului. Sistemul va fi capabil să observe, recunoască și monitorizeze scena, drumul, obiectele și persoanele din mediul exterior precum și expresia șoferului, oferindu-i informațiile necesare într-un mod cat mai non-invaziv (inclusiv interacțiuni vocală prin comenzi simple), capacitate crescuta de pilotaj și de luarea deciziilor.

Obiectivele specifice ale proiectului sunt:

  • Proiectarea acestor scenarii și a sistemului de dialog situațional în limba română presupune următoarele activități:
    • Construirea unui lexicon de cuvinte și expresii reprezentative pentru micro-lumea țintă. Exemple de micro-lumi sunt: i. o casa inteligentă; ii. Un robot acționând într-un mediu/spațiu specificat.
    • Extensia automată utilizând metode semantice moderne („continuous vector spaces”) a lexiconului creat manual la pasul 1a.
    • Crearea universului de discurs pentru micro-lumea/scenariul selectat. Acest pas implică identificarea relațiilor semantice care se stabilesc între cuvinte și care astfel devin predicate care vor fi validate (adevărat/fals) în contextul dialogului.
  • Intrările resursei lexico-semantice creată în pasul 1b vor fi transcrise fonetic și aliniate cu semnalul vocal corespunzător în cazul în care aceste înregistrări există în CoRoLa.
  • Sistemele de antrenare ASR și TTS vor fi alimentate cu rezultatele pasului 2. Sistemele ASR si TTS vor fi testate și validate.
  • Implementarea sistemului de dialog cooperant pentru micro-lumile selectate.

Originalitate și inovare:

Originalitatea soluției propusă de noi constă în primul rând în faptul că pentru limba română nu există o soluție similară implementată. Îmbinarea metodologiei scenariilor cu cea a semanticii distribuționale în realizarea unui sistem de monitorizare a dialogului este, după cunoștințele noastre, o abordare nouă și ambițioasă având în vedere caracterul de generalitate asumat.

Soluțiile tehnologice avute în vedere vor fi implementate modular, folosind tehnici de învățare automată de tip „deep learning”, pentru a permite adaptarea la noi micro-lumi și migrarea facilă în noi aplicații. Specificarea universului de discurs și corespondența acestuia cu cuvintele și expresiile din limba română se va face într-un mod standardizat (fișiere XML/RDF de exemplu).