Работим за възстановяване на приложението Unionpedia в Google Play Store
ИзходящIncoming
🌟Упростихме нашия дизайн за по-добра навигация!
Instagram Facebook X LinkedIn

Корпусна лингвистика

Index Корпусна лингвистика

Корпусната лингвистика е наука, която изучава езика чрез множество от реални езикови примери или текстове, събрани в общо цяло, наречено корпус.

Съдържание

  1. 9 отношения: Корпус (лингвистика), Речник, Текстология, Български национален корпус, Българско-английски паралелен корпус със съотнесени (прости) изречения (БУЛЕНСИ), БулПосКор, БулСемКор, Лингвистични свързани отворени данни, Лема (лингвистика).

Корпус (лингвистика)

Корпусът е основен обект на изследване и езиков ресурс в корпусната и компютърната лингвистика.

Виж Корпусна лингвистика и Корпус (лингвистика)

Речник

Многотомен латински речник в Университетската библиотека в Грац, Австрия Речникът е списък от думи с техните значения (тълковен речник) или списък от думи със съответстващите им думи на друг език (двуезичен речник) или езици (многоезичен речник).

Виж Корпусна лингвистика и Речник

Текстология

Текстологията (textus – „текст“ и lógos – „слово“, „наука“) е спомагателна за литературознанието филологическа дисциплина, която се занимава с изучаването на текстове и настъпилите в тяхпромени с цел датирането и установяването на точното съдържание на литературни паметници, исторически документи и други, както и установяването на авторството на анонимни творби.

Виж Корпусна лингвистика и Текстология

Български национален корпус

Българският национален корпус е голям представителен корпус за български език, който включва над 200 000 текста и над 1 милиард думи текстKoeva, Svetla, Ivelina Stoyanova, Svetlozara Leseva, Tsvetana Dimitrova, Rositsa Dekova, and Ekaterina Tarpomanova (2012).

Виж Корпусна лингвистика и Български национален корпус

Българско-английски паралелен корпус със съотнесени (прости) изречения (БУЛЕНСИ)

Българско-английският паралелен корпус със съотнесени (прости) изречения (БУЛЕНСИ) е структуриран корпус с паралелни текстове на български и английски език със сегментирани и съотнесени самостоятелни изречения и прости изречения в състава на сложните, с отбелязване на вида на синтактичната връзка.

Виж Корпусна лингвистика и Българско-английски паралелен корпус със съотнесени (прости) изречения (БУЛЕНСИ)

БулПосКор

Българският POS анотиран корпус (БулПосКор) е морфологично анотиран, общ едноезиков корпус от писмена реч за български, създаден от Секцията по компютърна лингвистика в Института за български език на БАН с големина 174 697 лексикални единици.

Виж Корпусна лингвистика и БулПосКор

БулСемКор

Българският семантично анотиран корпус (БулСемКор) е структуриран корпус с текстове на български език, в който на всички думи е приписано еднозначно лексикално или граматикализирано значение.

Виж Корпусна лингвистика и БулСемКор

Лингвистични свързани отворени данни

Лингвистичните свързани отворени данни (ЛСОД) в обработката на естествения език, езикознанието и съседни области представляват, от една страна, метод за описание на езикови ресурси, и от друга страна, интердисциплинарната общност от специалисти, които се занимават със създаването, споделянето и използването на езикови ресурси според принципите за свързаните данни.

Виж Корпусна лингвистика и Лингвистични свързани отворени данни

Лема (лингвистика)

Лѐма (lēmma, със значение „което е взето“, „което се предполага“, през lemma) е началната, речникова форма на думата.

Виж Корпусна лингвистика и Лема (лингвистика)