O problemach z koreferencją
PDF

Słowa kluczowe

referencja
koreferencja
korpus
anotacja

Abstrakt

DOI: http://doi.org/10.26333/sts.xxviii.17

Celem niniejszego artykułu jest omówienie niektórych problemów, które występują podczas określania koreferencji w tekście. Analizy takie były prowadzone na potrzeby projektu CORE – Komputerowe metody identyfikacji nawiązań w tekstach polskich (kierowanego przez Macieja Ogrodniczuka). Głównym celem projektu było stworzenie nowatorskich metod i narzędzi informatycznych służących do automatycznego wykrywania anafor i koreferencji w tekstach pisanych w języku polskim.

Główny problem z wyznaczaniem faz koreferencji w języku polskim wyłonił się w efekcie kilku czynników. Na poziomie pragmatycznym i semantycznym nie było proste zadecydować czy zachodziła identyczność, czy tylko podobieństwem między dwoma obiektami. Dodatkowym utrudnieniem był brak specjalistycznej wiedzy, który sprawił, że wyznaczenie faz koreferencji było szczególnie trudne między frazami w wyjątkowo specjalistycznych tekstach. Na poziomie gramatycznym, niektóre cechy języka polskiego utrudniły anotację. Ze względu na brak rodzajników określonych i nieokreślonych bardzo trudno było określić, czy nadawca zawsze miał na myśli ten sam obiekt, czy różne obiekty należące do tej samej klasy. Wreszcie, długie zdania bez podmiotu spowodowały pewne problemy przy wyznaczaniu łańcuchów koreferencyjnych między analizowanymi frazami.

PDF

Bibliografia

Fauconnier Gilles, Mark Turner. 2002. The Way We Think. Conceptual Blending and the Mind’s Hidden Complexities. New York: Basic Books.

Kunz Kerstin Anna. 2010. Variation in English and German Nominal Coreference. Frankfurt am Main: Peter Lang.

Langacker Ronald. 2009. Gramatyka kognitywna. Wprowadzenie. Kraków: Universitas.

Padučeva Elena Viktorovna. 1992. Wypowiedź i jej odniesienie do rzeczywistości. (Referencyjne aspekty znaczenia zaimków). Warszawa: PWN.

Recasens Marta, Eduard Hovy, M. Antonia Marti. 2010. A Typology of Near-Identity Relations for Coreference (NIDENT). W 7. International Conference on Language Resources and Evaluation, LREC 2010. European Language Resources Association (ELRA), N. Calzolari, K. Choukri, B. Maegaard, J. Mariani, J. Odijk, S. Piperidis, M. Rosner, D. Tapias (red.). Valletta: European Language Resources Association.

Recasens Marta, Eduard Hovy, M. Antonia Marti. 2011. "Identity, non-identity, and near-identity: Addressing the complexity of coreference". Lingua 121 (6) : 1138–1152.

Topolińska Zuzanna. 1984. Składnia grupy imiennej. W Gramatyka współczesnego języka polskiego. Składnia, Zuzanna Topolińska (red.). Warszawa: PWN.

Van Hoek Karen 2009. Pronouns and point of view: cognitive principles of coreference. W The new psychology of language: cognitive and functional approaches to language structure, vol. 2, M. Tomasello (red.). Tylor & Francis e-library.

Vater Heinz. 2009. Wstęp do lingwistyki tekstu. Struktura i rozumienie tekstów. Tłum. E. Błachut, A. Gołębiowski. Wrocław: Atut.

Wierzbicka Anna. 2010. Semantyka. Jednostki elementarne i uniwersalne. Lublin: Wydawnictwo UMCS.