Съдържание
9 отношения: Корпус (лингвистика), Речник, Текстология, Български национален корпус, Българско-английски паралелен корпус със съотнесени (прости) изречения (БУЛЕНСИ), БулПосКор, БулСемКор, Лингвистични свързани отворени данни, Лема (лингвистика).
Корпус (лингвистика)
Корпусът е основен обект на изследване и езиков ресурс в корпусната и компютърната лингвистика.
Виж Корпусна лингвистика и Корпус (лингвистика)
Речник
Многотомен латински речник в Университетската библиотека в Грац, Австрия Речникът е списък от думи с техните значения (тълковен речник) или списък от думи със съответстващите им думи на друг език (двуезичен речник) или езици (многоезичен речник).
Виж Корпусна лингвистика и Речник
Текстология
Текстологията (textus – „текст“ и lógos – „слово“, „наука“) е спомагателна за литературознанието филологическа дисциплина, която се занимава с изучаването на текстове и настъпилите в тяхпромени с цел датирането и установяването на точното съдържание на литературни паметници, исторически документи и други, както и установяването на авторството на анонимни творби.
Виж Корпусна лингвистика и Текстология
Български национален корпус
Българският национален корпус е голям представителен корпус за български език, който включва над 200 000 текста и над 1 милиард думи текстKoeva, Svetla, Ivelina Stoyanova, Svetlozara Leseva, Tsvetana Dimitrova, Rositsa Dekova, and Ekaterina Tarpomanova (2012).
Виж Корпусна лингвистика и Български национален корпус
Българско-английски паралелен корпус със съотнесени (прости) изречения (БУЛЕНСИ)
Българско-английският паралелен корпус със съотнесени (прости) изречения (БУЛЕНСИ) е структуриран корпус с паралелни текстове на български и английски език със сегментирани и съотнесени самостоятелни изречения и прости изречения в състава на сложните, с отбелязване на вида на синтактичната връзка.
БулПосКор
Българският POS анотиран корпус (БулПосКор) е морфологично анотиран, общ едноезиков корпус от писмена реч за български, създаден от Секцията по компютърна лингвистика в Института за български език на БАН с големина 174 697 лексикални единици.
Виж Корпусна лингвистика и БулПосКор
БулСемКор
Българският семантично анотиран корпус (БулСемКор) е структуриран корпус с текстове на български език, в който на всички думи е приписано еднозначно лексикално или граматикализирано значение.
Виж Корпусна лингвистика и БулСемКор
Лингвистични свързани отворени данни
Лингвистичните свързани отворени данни (ЛСОД) в обработката на естествения език, езикознанието и съседни области представляват, от една страна, метод за описание на езикови ресурси, и от друга страна, интердисциплинарната общност от специалисти, които се занимават със създаването, споделянето и използването на езикови ресурси според принципите за свързаните данни.
Виж Корпусна лингвистика и Лингвистични свързани отворени данни
Лема (лингвистика)
Лѐма (lēmma, със значение „което е взето“, „което се предполага“, през lemma) е началната, речникова форма на думата.