Dariah-SI
digital-humanities-at-uq-logo-4

Spletni seminar “Quanlify with ease: Combining quantitative and qualitative corpus analysis”

Vabljeni k udeležbi na spletnem seminarju v okviru projekta SSHOC z naslovom “Kvanlificirajte z lahkoto: kombiniranje kvantitativnih in kvalitativnih korpusnih analiz”.

Seminar bo potekal 16. aprila 2020 med 11. in 12. uro. Na seminar se lahko prijavite tukaj.

 

Veliko je razlogov, zakaj želijo raziskovalci humanističnih in družbenih ved združiti kvantitativno, podatkovno in algoritemskoo analizo besedila s kvalitativnim pregledom, hermenevtičnimi pristopi in interpretacijo. Pomemben razlog za to je doseganje intersubjektivnosti in utemeljenost veljavnosti ugotovitev. Dejansko obstajajo tehnološke rešitve za „kvanlifikacijo“ (potrjevanje kvantitativnih ugotovitev s kvalitativnimi sredstvi). Takšni pristopi so večinoma integrirane programske rešitve, ki temeljijo na lokalni ali strežniški osnovi, ki močno omejujejo možnosti za razvoj, preizkušanje in uvajanje novih delovnih procesov. Med tem vebinarjem bo Andreas Blätte, profesor javne politike in regionalne politike na univerzi Duisburg-Essen, razpravljal o ideji in izvajanju “kvanlifikacije”, ki se trenutno razvija v okviru projekta PolMine, ta se izvaja v statističnem programskem jeziku R. Paket sledi modularni zasnovi, ki bi uporabnikom jezika R s povprečnim znanjem omogočila prožno kombiniranje elementov delovnih tokov, ki vsebujejo kvantitativne in kvalitativne lastnosti, v razumljivo kodo, priročne grafične vmesnike ali interaktivne nadzorne plošče, ki jih je mogoče uporabljati v načinu z in brez povezave.

V tem spletnem seminarju boste:

  • Zvedeli več o konceptualnem sklepanju za kombiniranje kvantitativne in kvalitativne raziskovalne prakse pri delu z velikimi korpusi.
  • Odkrili nov pristop, kako je mogoče grafične uporabniške vmesnike in nadzorne plošče, ki izvajajo „kvantitativne“ delovne tokove, sestaviti z modularno zasnovo okvira “kvanlifikacije“.
  • Se pogovorili o tem, kako lahko izvajanje delovnih postopkov, ki združujejo količino in kakovost, postane čim bolj dostopno raziskovalcem, usmerjenim na besedilo, brez naprednih znanj za programiranje.

 

O vodji seminarja:

Andreas Blätte je profesor javne politike in regionalne politike na univerzi Duisburg-Essen. Po izobrazbi je politolog, vendar je razvil močno zanimanje za podatke in analitična orodja za uporabo korpusov v družboslovnih in humanističnih vedah. Objavil je tri pakete R (polmineR, RcppCWB in cwbtools), ki so na voljo prek CRAN-a. Njegovo največje raziskovalno zanimanje je diskurzivna razsežnost politike migracij in integracije.

O gostitelju:

Christoph Leonhardt dela kot znanstveni sodelavec na Inštitutu za politologijo Univerze v Duisburg-Essenu. Poleg ustvarjanja jezikovnih virov njegova trenutna raziskovalna zanimanja vključujejo razmerje med političnim diskurzom in institucionalnimi spremembami, zlasti združitev perspektiv politične znanosti in računalniške družbene znanosti.

 

 

KONFERENCA JEZIKOVNE TEHNOLOGIJE IN DIGITALNA HUMANISTIKA 2020

KONFERENCA JEZIKOVNE TEHNOLOGIJE IN DIGITALNA HUMANISTIKA 2020
24.-25. september 2020
Inštitut za novejšo zgodovino
Privoz 11, Ljubljana

www.sdjt.si/jtdh-2020

Slovensko društvo za jezikovne tehnologije (SDJT), Center za jezikovne vire in tehnologije Univerze v Ljubljani (CJVT), Inštitut za novejšo zgodovino (INZ) ter raziskovalni infrastrukturi CLARIN.SI in DARIAH-SI bodo 24. in 25. 9. 2020 organizirali konferenco “Jezikovne tehnologije in digitalna humanistika”, ki se ponaša z več kot 20-letno tradicijo, tematsko širitev na digitalno humanistiko pa smo uvedli leta 2016.

Na konferenco vabimo raziskovalce, ki delujejo v različnih disciplinah in metodoloških okvirih.

Vabimo prispevke z naslednjih področij:

govorne in druge eno- in večjezične jezikovne tehnologije;
digitalno jezikoslovje: prevodoslovje, korpusno jezikoslovje, leksikologija in leksikografija, standardizacija;
digitalna humanistika in zgodovinopisje, literarne vede, etnologija, muzikologija, kulturna dediščina, umetnost ter arheologija;
digitalna humanistika v izobraževanju in digitalna publicistika.

Dobrodošli so prispevki, ki predstavljajo smernice, raziskave, dobre prakse, projekte in rezultate na teh področjih. V sklopu konference bodo tudi vabljeni predavanji, študentska sekcija ter paneli o aktualnih temah, povezanih s konferenco. Uradna jezika konference bosta slovenščina in angleščina.

Vse ostale informacije lahko dobite na spletni strani konference.

contributions_cr

Prispevki za novejšo zgodovino/ Contributions of Contemporary History, Digital Humanities and Language Technologies, 2019, no. 1

Na povezavi http://ojs.inz.si/pnz/issue/view/18 je dostopna nova tematska številka Prispevkov za novejšo zgodovino, Digital Humanities and Language Technologies, 2019, št. 1.

 

Aktualna posebna izdaja revije Prispevki za novejšo zgodovino prinaša članke, za katere se zdi, da lomijo uveljavljeno uredniško tradicijo. Revijo od leta 1960 redno izdaja Inštitut za novejšo zgodovino, ki se je do leta 1986 imenoval Inštitut za zgodovino delavskega gibanja. Revija je bila preimenovana v istem času kot inštitut, od takrat pa je postala ena večjih slovenskih znanstvenih revije s področja zgodovine, ki objavlja članke o sodobni zgodovini (19. in 20. stoletje) srednje in jugovzhodne Evrope. Z vzpostavitvijo infrastrukturnega programa Raziskovalna infrastruktura slovenskega zgodovinopisja je Inštitut vstopil na področje digitalne zgodovine in je od leta 2008 prispeval k vzpostavitvi evropske digitalne raziskovalne infrastrukture za umetnost in humanistiko (DARIAH). Inštitut za novejšo zgodovino se je začel razvijati v eno od večjih digitalnih humanističnih središč v Sloveniji. Sedanja posebna izdaja je eden od rezultatov te nove raziskovalne usmeritve založnika in odraža izrazit interdisciplinarni in heterogeni profil digitalne humanistike.
S to posebno številko praznujemo 20. obletnico prve konference Jezikovne tehnologije, ki je potekala leta 1998 v Cankarjevem domu v Ljubljani, v organizaciji Tomaža Erjavca, Vojka Gorjanca, Jerneje Žganec Gros in Anice Rant. Teme prve konference so bile razvoj in uporaba jezikovnih tehnologij za slovenščino in usmeritve za prihodnost. Konferenca je od takrat potekala vsaki dve leti in se je nedavno razširila na digitalno humanistiko. Digitalna humanistika je kot stičišče digitalnih tehnologij in humanističnih ved zelo dejavno raziskovalno področje, kjer se digitalne tehnologije uporabljajo pri študiju jezika, družbe in kulture, vendar pa tudi raziskave na področju humanistike utirajo pot razvoju novih digitalnih tehnologij. Digitalna humanistika je izrazito interdisciplinarno in sodelovalno področje, ki preoblikuje tradicionalne prakse v humanistiki in deluje kot katalizator novih analitičnih tehnik in metod ter spodbuja razpravo med različnimi zainteresiranimi stranmi na tem področju. Cilj te pobude je spodbuditi integracijo disciplin in hkrati pomembno vlogo vozlišča za kolege raziskovalce v regiji.
Povabili smo avtorje 11 najbolj preglednih rednih člankov in najboljši študentski prispevek, ki je bil predstavljen na konferenci Jezikovne tehnologije in digitalne humanistike, ki je potekala 20. in 21. septembra 2018 v Ljubljani, v organizaciji Društva slovenskih jezikovnih tehnologij, Centra za jezikovne vire. in tehnologije na Univerzi v Ljubljani, Fakulteti za elektrotehniko Univerze v Ljubljani in raziskovalnih infrastrukturah CLARIN.SI in DARIAH-SI. Avtorji desetih rednih prispevkov in študentskega prispevka s področij jezikovnih tehnologij, digitalne lingvistike in digitalne humanistike so sprejeli povabilo in pripravili razširjene prispevke, ki so pomembni za mednarodno javnost, nato pa so jih mednarodni recenzenti ponovno pregledali.

KONFERENCA JEZIKOVNE TEHNOLOGIJE IN DIGITALNA HUMANISTIKA 2018

KONFERENCA JEZIKOVNE TEHNOLOGIJE IN DIGITALNA HUMANISTIKA 2018

Fakulteta za elektrotehniko, Univerza v Ljubljani
20. 9.–21. 9. 2018

Slovensko društvo za jezikovne tehnologije (SDJT), Center za jezikovne vire in tehnologije Univerze v Ljubljani (CJVT) ter raziskovalni infrastrukturi CLARIN.SI in DARIAH-SI 20. in 21. 9. 2018 organizirajo konferenco “Jezikovne tehnologije in digitalna humanistika”, ki se ponaša z več kot 20-letno tradicijo, tematsko širitev na digitalno humanistiko pa smo uvedli leta 2016.

Tematska področja konference

Na konferenco vabimo raziskovalce, ki delujejo v različnih disciplinah in metodoloških okvirih. Vabimo prispevke z naslednjih področij:

  • govorne in druge eno- in večjezične jezikovne tehnologije;
  • digitalno jezikoslovje: prevodoslovje, korpusno jezikoslovje, leksikologija in leksikografija, standardizacija;
  • digitalna humanistika in zgodovinopisje, etnologija, muzikologija, kulturna dediščina, umetnost ter arheologija;
  • digitalna humanistika v izobraževanju in digitalna publicistika.

Dobrodošli so prispevki, ki predstavljajo smernice, raziskave, dobre prakse, projekte in rezultate na teh področjih. V sklopu konference bodo tudi vabljena predavanja, študentska sekcija ter paneli o aktualnih temah, povezanih s konferenco.

Avtorje izbranih člankov bomo povabili, da svoje prispevke iz JTDH 2018 razširijo za posebno angleško številko revije Prispevki za novejšo zgodovino. Revija je indeksirana v informacijskem servisu Scopus. Vsak od izbranih prispevkov bo recenziran po običajnem recenzentskem postopku in ga bo potrebno pripraviti v skladu s smernicami, ki jih najdete v navodilih za avtorje.

Navodila za prispevke

Za konferenco zbiramo tako razširjene povzetke kot tudi polne prispevke. Razširjeni povzetki bodo objavljeni v knjižici povzetkov, polni prispevki pa v konferenčnem zborniku, ki bo ob začetku konference objavljen na konferenčni spletni strani pod licenco Creative Commons. Avtorjem prepuščamo odločitev, ali bodo oddani razširjeni povzetek oz. polni prispevek anonimizirali ali ne.
Uradna jezika konference sta angleščina in slovenščina.

Več na spletni strani konference.

OpenMethods: Highlighting Digital Humanities Methods and Tools

Nova platfoma Odprte metode je namenjena prikazovanju uredniško pregledanih vsebin o metodah in orodjih v digitalni humanistiki.

V času, ko postajajo digitalne metode in orodja vse bolj vsakdanja rutina raziskovalcev s področja humanistike, predstavljajo prikazi praktične uporabe, opisi znanstvenih dosežkov, doseženih s pomočjo metod digitalne humanistike in teoretični prikazi pomemben del znanstvene komunikacije. Poznavanje in kritična ocena teh tehnologij je nujna za ustrezno evalvacijo teh dosežkov.
Ob vse večji poplavi gradiv na to temo, ki so dostopna na svetovnem spletu, od blogov, člankov, strokovnih poročil in drugih materialov, se je pojavila potreba po poudarjanju in promociji posebej pomembnih večjezičnih in multidisciplinarnih prosto dostopnih vsebinah s polja digitalne humanistike na enem mestu.

Platforma nastaja v okviru panevropske iniciative DARIAH, in sicer v okviru projekta iz programa Obzorje 2020 Humanities at Scale v sodelovanju s projektom OPERAS.

Prednosti in slabosti akademskih družbenih omrežij

30. maja je v Zemljepisnem muzeju Geografskega Inštituta Antona Melika ZRC SAZU potekalo predavanje o uporabi akademskih družbenih omrežij, ki ga je vodil dr. Dejan Jontes s Fakultete za družbene vede Univerze v Ljubljani. Posnetek predavanja si lahko ogledate na spodnji povezavi.

Digitalna diplomatika: nov obseg interpretacije historičnih dokumentov

HISTORIČNI SEMINAR Znanstvenoraziskovalnega centra Slovenske akademije znanosti in umetnosti v sodelovanju s Podiplomsko šolo ZRC SAZU sta organizirala predavanje:

Digitalna diplomatika: nov obseg interpretacije historičnih dokumentov.

Predaval je prof. dr. Georg Vogeler.

Predavanje je bilo v torek, 16. maja 2017, ob 11. uri. v Mali dvorani ZRC SAZU, Novi trg 4, 2. nadstropje.

Diplomatika ima kot stara pomožna zgodovinska veda (uvedel jo je  Mabillon v 17. stoletju) jasno določen obseg in predmet: preučevanje  uradnih zgodovinskih dokumentov (listin) kot zanesljivih virov, saj vsebujejo razločen podatek o kraju in datumu nastanka. Zato so ti dokumenti relevantni ne le za zgodovinske raziskave, marveč tudi za  jezikoslovje in druge discipline, ki se ukvarjajo z zgodovinskimi  dejstvi. Vendar listine ne govorijo vedno resnice. Diplomatika je svojo  temeljno metodologijo razvila prav zato, da bi identificirala ponaredke.  Vse od nastanka diplomatike so se njeni raziskovalni interesi razvijali  zlasti v smeri kulturne zgodovine (pismenost, simbolna komunikacija  ipd.). Z razvojem računalniških tehnologij pa se je razvila tudi moderna  veja: »digitalna diplomatika«. Predavanje bo pokazalo, kaj to  raziskovalno področje obsega in kako vpliva na raziskovalne interese  diplomatike. Ta primer lahko služi kot zgled, ob katerem bolje razumemo,  kaj se zgodi, če digitalna orodja apliciramo na raziskovalne objekte  humanistov.

Georg Vogeler deluje kot profesor za pomožne historične vede in njihovo  uporabo v digitalni humanistiki na univerzah v Gradcu in Münchnu. Bil je  med ustanovnimi člani raziskovalne ustanove Institut für Dokumentologie  und Editorik za razvoj digitalnih metod na področju znanstvenega  izdajanja besedil, še posebej historičnih dokumentov. Od leta 2006 je  tehnični direktor konzorcija monasterium.net, ki obsega že čez 500.000  listin iz srednjega in zgodnjega novega veka. Od leta 2007 je  monasterium.net vključen v konzorcij ICARUS, kjer dr. Vogeler opravlja  naloge tehničnega direktorja za celoten konzorcij. Vodil ali  soorganiziral je vrsto simpozijev in poletnih šol na temo digitalne  humanistike, zlasti serijo mednarodnih simpozijev Digital Diplomatics.

Predavanje je bilo v angleščini.

Vljudno vabljeni!
Več o Historičnem seminarju tudi na http://hs.zrc-sazu.si.

Zbornik prispevkov s konference Jezikovne tehnologije in digitalna humanistika

Na spletni strani Slovenskega društva za jezikovne tehnologije je dostopen zbornik prispevkov, ki so nastali v okviru prve konference Jezikovne tehnologije in digitalna humanistika. Konferenca je potekala med 29. 9. in 1. 10. 2016 in je prvič združila prizadevanja s polja jezikovnih tehnologij in digitalne humanistike. Zbornik vsebuje 58 sprejetih prispevkov, od tega 5 prispevkov vabljenih predavateljev, 30 rednih polnih prispevkov in 17 povzetkov ter 6 študentskih prispevkov, pri čemer je 41 prispevkov v slovenskem, ostali pa v angleškem, hrvaškem, srbskem in bosanskem jeziku.

Prispevki vabljenih predavateljev so bili posneti in so skupaj s predstavitvami dostopni na portalu Videolectures.

 

 

Konferenca Jezikovne tehnologije in digitalna humanistika

KONFERENCA JEZIKOVNE TEHNOLOGIJE IN DIGITALNA HUMANISTIKA

Filozofska fakulteta, Univerza v Ljubljani
29. 9.–1. 10. 2016

Prvo vabilo za prispevke

Ob jubilejni deseti konferenci Jezikovne tehnologije smo se odločili za programsko širitev na področje digitalne humanistike, ki je kot presek digitalnih tehnologij in humanistike aktualno raziskovalno področje, kjer se na eni strani digitalne tehnologije uporabljajo pri raziskavah v humanistiki za študij jezika, družbe in kulture, na drugi strani pa je humanistika tudi spodbudna za razvoj novih tehnoloških rešitev, kot npr. kažejo revija JDH, zveza ADHO s svojimi letnimi konferencami DH in mreža NeDiMAH.

V samem izhodišču je digitalna humanistika izrazito interdisciplinarno in kolaborativno raziskovalno delo, ki bistveno spreminja ustaljene humanistične pristope ter spodbuja razvoj novih analitičnih tehnik in metod, v slovenskem prostoru pa nima skupnega mesta za predstavitev dosežkov svojega dela in diskusijo med različnimi deležniki na področju. Tu zaostajamo za primerljivimi in sosednjimi državami, saj so npr. v Pragi septembra 2015 organizirali prvo konferenco o digitalni humanistiki na Češkem, na Dunaju pa decembra 2015 poteka že druga konferenca o Digitalni humanistiki v Avstriji.

Zato bodo Slovensko društvo za jezikovne tehnologije (SDJT), Center za jezikovne vire in tehnologije Univerze v Ljubljani (CJVT) ter raziskovalni infrastrukturi CLARIN.SI in DARIAH-SI konec septembra 2016 organizirali konferenco “Jezikovne tehnologije in digitalna humanistika”.

Na konferenci bi si želeli zbrati prispevke z naslednjih področij:

  • govorne in druge eno- in večjezične jezikovne tehnologije
  • digitalno jezikoslovje: korpusno jezikoslovje, leksikologija in leksikografija, standardizacija; prevodoslovje
  • digitalna humanistika in zgodovinopisje, etnologija, muzikologija, kulturna dediščina, umetnost ter arheologija
  • digitalna humanistika v izobraževanju in digitalna publicistika

Dobrodošli so prispevki, ki predstavijo smernice, raziskave, dobre prakse, projekte in rezultate na teh področjih.

V sklopu konference predvidevamo tudi vabljena predavanja, študentsko sekcijo ter panele o temah, povezanih s konferenco.

Pomembni datumi

  • 01. 03. 2016    oddaja razširjenega povzetka
  • 01. 04. 2016    obvestilo o sprejetju povzetka
  • 01. 06. 2016    (oddaja celotnega prispevka)
  • 15. 07. 2016    (obvestilo o sprejetju prispevka)
  • 01. 09. 2016    oddaja končnega prispevka oz. povzetka
  • 29. 09.–01. 10. 2016    KONFERENCA

Navodila za prispevke

Prispevke bomo zbirali najprej kot razširjene povzetke, nato pa se bodo avtorji sprejetih prispevkov odločili, ali bodo povzetek razširili v polni prispevek, ki bo ponovno recenziran in objavljen v zborniku, ali pa bodo ostali pri razširjenem povzetku, ki bo objavljen v knjižici povzetkov.

Uradni jeziki konference so angleščina, slovenščina, hrvaščina, srbščina, bosanščina, črnogorščina in makedonščina.

Razširjeni povzetki naj bodo dolgi dve strani (brez bibliografije), polni prispevki pa 8–10 strani. Končna verzija obojih mora biti stavljeni v skladu s predlogo konference, ki jo bomo objavili v kratkem.

Prispevke zbiramo preko platforme EasyChair na naslovu
https://easychair.org/conferences/?conf=jtdh2016

Avtorji prispevkov naj označijo, ali gre za študentski prispevek, kjer morajo vsi avtorji biti do- ali podiplomski študentje. Ti prispevki bodo na konferenci imeli svojo sekcijo, izbran in nagrajen pa bo tudi najboljši študentski prispevek.

Knjižica povzetkov in zbornik prispevkov bosta dostopna na spletu ob začetku konference.

Več o dogodku na spletni strani konference.

Označevalni jezik XML–TEI v humanistiki

Uvodna delavnica o digitalni humanistiki

Predstavitev je potekala v sredo, 15. oktobra 2014, od 9. do 14. ure v Prešernovi dvorani SAZU.

 

Uvod v XML in TEI

Tomaž Erjavec

 

V predavanju smo spoznali osnove standarda za označevanje XML. Ogledali smo si zgradbo dokumentov in model označevanja v XML, na kratko pa obravnavali tudi kodiranje znakov s poudarkom na standardu Unikod. Nato so bile predstavljene sheme XML, ki omogočajo formalno definicijo gramatike in nabora oznak za določen tip dokumentov. V drugem delu predavanja smo spoznali Iniciativo za zapis besedil TEI (Text Encoding Initiative). Smernice definirajo sistem za izgradnjo shem XML in podrobno dokumentirajo preko 500 elementov, ki jih TEI predvideva za označevanje zelo raznorodnih tipov besedil in za raznovrstne analitične obravnave. Podali smo motivacijo za ustanovitev in zgodovinski pregled TEI ter glavne prednosti uporabe Smernic TEI za zapis in označevanje besedil.

 

Uvod v TEI

Matija Ogrin

Smernice konzorcija TEI  skušajo ustreči raznolikim potrebam humanistov, katerih glavni predmet preučevanja so besedila. Smernice določajo obsežen nabor oznak XML, s katerimi je moč označiti (kodirati) raznolike strukture humanističnih besedil. Oznake so združene v module za razna področja dela z besedili. V predavanju bomo spoznali splošno strukturo, predpisano za dokumente TEI, in najpomembnejše module, ki jih humanisti uporabljamo pri delu z besedili.

 

Primer uporabe: znanstvene izdaje primarnih virov

Matija Ogrin

Eno od temeljnih delovnih področij v vseh historičnih in filoloških vedah je izdajanje znanstvenih edicij primarnih virov (starejših tiskov, rokopisov). Temu delu je namenjen eden od modulov TEI in pripadajoče poglavje Smernic. V predavanju smo orisali najbolj pogoste strukture in označevalne prakse, relevantne za pripravo izdaje (starejših) besedil.

 

Primer uporabe: opis rokopisov

Matija Ogrin

Rokopisi predstavljajo enega najpomembnejših segmentov kulturne, zlasti slovstvene dediščine, zato po svetu in pri nas nastajajo elektronske zbirke, ki predstavljajo podrobne opise rokopisov skupaj z digitalnimi faksimili izvirnika. Smernice TEI so temu področju namenile poseben modul, ki je v predavanju predstavljen v raznih možnostih od manj do bolj kompleksnega označevanja.

 

Primer uporabe: biografski in prozopografski podatki 

Petra Vide Ogrin

Smernice TEI namenjajo poseben modul biografskim in prozopografskim podatkom, ki jih srečujemo v arhivskih regestah, prozopografijah in predvsem v leksikografskih publikacijah. Na te smernice je bilo oprto označevanje biografskih podatkov v spletnem portalu Slovenska biografija, ki obsega tri leksikone: Slovenski biografski leksikon (1925-1991), Primorski slovenski biografski leksikon (1974-1994) in Novi Slovenski biografski leksikon (2013). V predstavitvi smo nakazali, kako so nam oznake TEI omogočile podrobno označevanje osebnih in variantnih imen, nazivov in plemiških predikatov, krajevnih imen, datumov, poklicev oz. dejavnosti in sorodstvenih vezi ter njihovih posebnosti.

 

Primer uporabe: izvorno digitalni podatki in strukturirani podatki

Andrej Pančur

Smernice TEI so bile prvotno sicer narejene za označevanje digitaliziranih tiskanih besedil analognih besedil, toda v zadnjih letih se vedno pogosteje uporabljajo pri označevanju raznovrstnih izvorno digitalnih besedil, med drugim tudi znanstvenih publikacij. V predavanju smo obravnavali prednosti in pomanjkljivosti elektronskega založništva v humanistiki po Smernicah TEI v primerjavi z nekaterimi drugimi v založništvu splošno razširjenimi označevalnimi jeziki (DocBook, XHTML, HTML5). Poleg tega smo prikazali, kako je mogoče v izvorno digitalna besedila vključiti strukturirane podatke iz tabel in relacijskih baz podatkov.

Primer uporabe: jezikoslovno označeni korpusi in slovarji

Tomaž Erjavec

Računalniški korpusi besedil predstavljajo osnovo za empirične raziskave jezika, tako pri temeljnih jezikoslovnih raziskavah kot pri uporabnem jezikoslovju, predvsem slovaropisju. Smernice TEI imajo poseben modul za zapis korpusov, dodaten modul pa za jezikoslovne oznake, ki jih lahko dodajamo besedilom, s čimer naredimo korpus bistveno bolj uporaben. V predavanju bomo pogledali nekaj primerov jezikoslovno označenih korpusov slovenskega jezika, nato pa še primere zapisa slovarskih podatkov, za katere Smernice tudi ponujajo samostojen modul.