Projekt naslavlja izboljšave procesiranja naravnega jezika s pomočjo medjezikovnega prenosa znanja. Na primer, napovedni modeli za odkrivanje sovražnega govora lahko uporabljajo angleščino za učenje, uporabljajo pa se tudi v hindujščini ali slovenščini. Naše dosedanje raziskave so pokazale, da je mogoče s kombiniranjem temeljnih jezikovnih virov iz več jezikov in angleščine ustvariti zelo uspešne medjezikovne modele tudi za jezike z manj jezikovnimi viri. Projekt bo omogočil pridobivanje koristnih informacij iz družbenih medijev, kot je npr. odnos ljudi do epidemioloških ukrepov, političnih situacij in uradnih oseb. Vključitev geolokacijskih metapodatkov v te analize omogoča tudi analizo po posameznih geografskih regijah. Delo bo osredotočeno na tri jezike, angleščino, kot jezik s številnimi jezikovnimi viri, pa tudi hindujščino in slovenščino, kamor bomo prenesli izdelane medjezikovne modele. Razvite temeljne tehnologije bodo izboljšale jezikovne in sociološke analize nestandardne komunikacije v družbenih medijih, koristile pa bodo tudi študijam digitalnih humanističnih ved.