itthon » Ehetetlen gomba » A matematikai módszereket a nyelvészetben alkalmazó nyelvészek. Matematikai módszerek az összehasonlító nyelvészetben

A matematikai módszereket a nyelvészetben alkalmazó nyelvészek. Matematikai módszerek az összehasonlító nyelvészetben

Kétségtelen, hogy a matematikai és logikai módszerek („egzakt módszerek”) nyelvtudományi alkalmazását nagymértékben az alkalmazott nyelvészet feladatai ösztönözték. Ha megpróbálták ezeket a módszereket alkalmazni az elméleti nyelvészet területéhez közvetlenül kapcsolódó problémák megoldására, például a nyelv és a beszéd jelenségeinek megkülönböztetésére *, akkor a jövőben (bár talán nem mindig világos és közel) az alkalmazott nyelvészet igényeit szem előtt tartva. Ez egyébként azt jelenti, hogy az ilyen műveletek eredményeinek értékelését az alkalmazott nyelvészet célkitűzéseinek kötelező figyelembevételével kell elvégezni.

* (Lásd: G. Herdan, Language as Choice and Chance, Groningen, 1956.)

E módszerek általános szempontból teljesen új területen való alkalmazásának sikerét nagymértékben meghatározza az arra a kérdésre adott válasz, hogy mennyiben megengedett a logikailag helyes nyelv azonosítása természetes nyelvvel, vagy más megfogalmazásban. , lehetséges-e csökkenteni a másodikat az elsőre *. Erre a kérdésre a választ általában gyakorlati formában adjuk meg - statisztikai, információelméleti, halmazelméleti, valószínűségelméleti és egyéb matematikai nyelvi modellek felépítésével, amelyek azonban nem mindig konkrét feladatokra irányulnak * *. Az effajta modellek megalkotásakor szerzőik gyakran abból a feltevésből indulnak ki (szempontjukból nyilvánvaló), hogy a formális logikai vagy matematikai apparátus bármilyen nyelvi leírásra és kutatásra történő alkalmazása automatikusan hozzájárul azok fejlesztéséhez. Warren Platt jól mondta ezt a matematikai nyelvészeti munkák áttekintésében: „Ha a nyelvi modelleket diszkrét elemek absztrakt rendszereinek tekintjük, akkor különféle matematikai fogalmak és módszerek alkalmazhatók rájuk, kezdve a szám elemi gondolatától és a befejezésig. bonyolult „logikai, statisztikai és halmazelméleti műveletekkel. Az az elképzelés azonban, hogy számok és matematikai műveletek bármilyen felhasználása az ilyen elemrendszerek leírására „pontosabbá” vagy „tudományosabbá” teszi az állításokat, teljesen téves. Először is be kell mutatni, hogy az így kapott új rendszer kielégítőbb modell, mint az eredeti rendszer, vagy abban az értelemben, hogy lehetővé teszi egyszerűbb és általánosabb elméleti állítások megfogalmazását a modellezett tartomány egyes aspektusairól, vagy mert a műveletek egy modellre rávilágítanak a megfelelő műveletek eredményeire a modellezett területen A matematikai nyelvi modellek, különösen a mennyiségi modellek megalkotásával kapcsolatos egyik fő veszély az, hogy a matematikai apparátus válogatás nélküli használata elkerülhetetlenül értelmetlen és félrevezető eredményekhez vezet. Ezért világosan meg kell értenünk, „hogy a nyelvészet matematika segítségével való gazdagításának feltétele nemcsak a matematika releváns területeinek ismerete, hanem a nyelvi problémák lényegének, megoldásának mély megértése is. amelyek közül a matematikai módszerekre kell irányulni.

* (Házasodik. G. Curry megjegyzése: „Ami létezik szoros kapcsolat egyrészt a matematika és a logika, másrészt a nyelv között elég régen nyilvánvalóvá vált, és mára ez a tény a szigorúbb gondolkodás középpontjába került..." (N.V. Curry, Some Logical Aspects of Grammatical Structure, a "Nyelv szerkezete és matematikai vonatkozásai" szimpóziumban, Providence, 1961, 57. o.)

** (E tekintetben nagyon időszerű P. Garvin megjegyzése (W. Bar-Hillel: Language and Information: Selected Essays on Their Theory and Application, London, 1964) című könyvének recenziójában: „A legtöbb munka az elmélettel foglalkozik. A számítástechnikai gépek teljesen naivak, és kétségtelenül nem olyan hasznosak, mint az kívánatos lenne." Ami Bar-Hillel negatív álláspontját illeti a beszédinformációk automatikus feldolgozására szolgáló logikai-matematikai módszerek hatékonyságával kapcsolatban, P. Garvin úgy véli, hogy ez még mindig tartalmaz pozitív elemeket, mivel ez az álláspont „legalábbis néhány tudóst arra kényszerít majd, hogy kevésbé vegyék komolyan elméleteiket”. ("American Documentation" magazin, New York, 16. kötet, 2. szám, 1965, 127. o.).)

*** (W. Plath, Matematikai nyelvészet. A könyvben: "Trends in European and American Linguistics 1930-1960", Antwerpen, 1961, pp. 22-2E.)

A Warren Platt által jelzett veszély lehetőség szerinti elkerülése érdekében nemcsak tisztán empirikus kísérletekre van szükség a fent megfogalmazott kérdés megválaszolására, hanem törekedni kell annak általános elméleti megértésére is. Valójában a természetes nyelv egyik vagy másik logikai-matematikai modellre vagy értelmezésre való visszavezethetőségének kérdése az alkalmazott nyelvészet elméletének fő kérdése, amelynek megalkotására egyre sürgetőbben érezhető az igény. Ennek a kérdésnek a mérlegelésekor mindenekelőtt azoknak a jelenségeknek a természetét kell figyelembe venni, amelyek egyrészt a logika és a matematika, másrészt a természetes nyelv tanulmányozásának tárgyát képezik, másrészt pedig annak lehetőségeit is. a módszerek, amelyekkel az egyes tudományok működnek. Már ezeknek a pontoknak az összehasonlító vizsgálatából is le lehet vonni néhány általános következtetést, amelyek hasznosak lehetnek mindazok számára, akiknek szükségszerűen a felsorolt ​​tudományok metszéspontjában kell végezniük kutatásaikat.

Bizonyos mértékig ezt a célt szolgálja az Amerikai Matematikai Társaság * A nyelv szerkezete és matematikai vonatkozásai című szimpóziuma. De mindegyik – amint az már a szimpózium címéből is kitűnik – csak a minket érdeklő probléma egyedi, esetenként egészen konkrét aspektusait érinti. Noha ezek együttesen kellően megalapozott előfeltételeket teremtenek az általunk vizsgált kérdés megválaszolásához, még mindig hiányzik belőlük a szükséges következtetések egyértelmű és egyértelmű megfogalmazása. A szimpózium résztvevői sok tekintetben folytatják a probléma megoldására irányuló empirikus kísérletek sorát, anélkül, hogy kísérleteiket tolakodóan a nyelvészek figyelmébe ajánlanák, abban a reményben, hogy ők maguk is rájönnek, mennyire alkalmasak az általuk bemutatott hipotézisek és megoldások céljaikra. .

* ("A nyelv szerkezete és matematikai vonatkozásai". Proc. a Szoc. az Appl. Math., 12. Providence, 1961.)

Ezért az általunk vizsgált kontextusban a nyelvészek, logikusok és matematikusok munkájának eredményeinek megértéséhez kiindulópontul alkalmasabb a „Természetes nyelv és a számítástechnika” gyűjteményben megjelent két cikk *: M. Maron „The Logician's Point of the Processing of Linguistic Data” és P . Garvin és V. Karash „Linguistics, linguistic data processing and mathematics”. Felvázolják a logika és a matematika munkalehetőségeit, kapcsolatukat az empirikus tudományokkal, problémamegoldási módszereket stb. Térjünk rá a cikkek által felvetett problémák mérlegelésére a fent megfogalmazott kérdés szempontjából.

* ("A természetes nyelv és a számítógép", szerk. bv P. Garvin, New York, 1963.)

2

Úgy tűnik, hogy kérdésünkre már teljesen egyértelmű választ kaptunk. Például N.D. Andreev és JI. R. Zinder írja: „A nyelvek matematikai ábrázolása (modellje) semmiképpen sem azonos magával a nyelvvel” *. Őket követi a „Nyelvmodellek” című könyv szerzője, I. I. Revzin is, aki rámutat arra, hogy a modellezés eredményeként csak „a konkrét valóság adatainak többé-kevésbé közeli közelítése”** jelenhet meg. Ezt kimondani azonban azt jelenti, hogy nem mondunk semmit, hiszen továbbra is tisztázatlan, hogy miért van ez így, és hogy érdemes-e mégis a matematikai és logikai modellezés módszeréhez fordulni, és ha igen, milyen mértékben és milyen céllal.

* (N. D. Andreev, L. P. Zinder, Az alkalmazott nyelvészet alapvető problémái, „A nyelvészet kérdései”, 1959, 4. sz., 18. o.)

** (I. I. Revzin, Models of Language, M., 1962, 8. o. Egyébként a „közeli közelítés” kifejezés közvetlen tautológia: szoros közelítés.)

Mindezen kérdések megoldásához először is meg kell állapítani, hogy mely tudományok – induktív vagy deduktív – tartalmazzák a nyelvészetet, a logikát és a matematikát. Ami az utóbbi két tudományt illeti, álláspontjuk egyértelmű – kétségtelenül a deduktív tudományok közé tartoznak, amelyek kutatási módszertanukban következtetésekre támaszkodnak. A nyelvészetet hagyományosan empirikus tudományként határozzák meg, ami arra utal, hogy fő tudományos célja a tények leírása. Ez láthatóan azt jelenti, hogy a nyelvészetet az induktív tudományok körébe kell sorolni. Ez egyben azt is jelenti, hogy a logika és a matematika formális apparátusát próbálva a nyelvészetben alkalmazni, deduktív kutatási módszereket próbálnak alkalmazni az induktív tudományban.

Azonban in utóbbi évek a nyelvtudomány - a nyelvészet - induktív jellegét közvetve vagy közvetlenül kezdték megkérdőjelezni. Ezt L. Elmslev tette a legdrámaibb formában. Igaz, az általa használt terminológia nagyon zavaros, és különösen a „kivezetés” és az „indukció” kifejezések sajátos és nagyon személyes megértése jellemzi (valójában teljesen ellentétes módon értelmezi). Nyelvelméletének általa felvázolt alapjai azonban nem hagynak kétséget a módszertani lényeg felől. Igen, gondolja elfogadható használat bármilyen kezdeti műveleti definíció, ami a deduktív tudományokra jellemző. Ő maga pedig a következőképpen jellemzi elméletét: „1. A mi értelemben vett elmélet önmagában nem mond semmit sem alkalmazásának lehetőségéről, sem a kísérleti adatokhoz való viszonyáról tartalmazza a létezés posztulátumát. Ez az, amit tisztán deduktív rendszernek neveznek abban az értelemben, hogy önmagában is felhasználható a premisszákból adódó lehetőségek kiszámítására. 2 Másrészt egy elmélet számos ismert premissát tartalmaz A korábbi tapasztalatok alapján bizonyos kísérleti adatokra vonatkozóan ezek a feltételek a legáltalánosabbak, és ezért számos kísérleti adat esetében kielégítik az alkalmazás feltételeit.

* („Prolegomena a nyelvelmélethez”. Ült. „Új a nyelvészetben”, vol. 1, M., 1960, 274-275.)

Amint ebből az állításból kitűnik, L. Elmslev a nyelvészeti kutatás tárgyai kettős módszertani természetének gondolatát igyekszik előmozdítani, elsősorban deduktív jellemzőikre helyezve a hangsúlyt. Neki kell érdemelni azt a meglehetősen kétértelmű módszert is ("egyrészt... de másrészt..."), amely általában jellemzővé vált e kérdés mérlegelésére (és amely lehetővé teszi, hogy bármilyen irányba forduljunk) ). A nyelvészet módszertani kettősségének gondolata a közelmúltban széles körben elterjedt, sőt elméleti alapként szolgált a nyelvtudomány legújabb iránya - az univerzalizmus nyelvészete (univerzalizmus) - elveinek megfogalmazásához. A „Memorandum on Linguistic Universals” erről szól: „A nyelvi univerzálék tanulmányozása empirikus általánosítások egész sorához vezet a nyelvi viselkedést illetően – mind a még kísérletezést igénylő, mind a már kialakult általánosításokhoz A tudományos törvények némelyikének és talán többségének azonban még mindig csak empirikus általánosítási státusza van, amelyek ismereteink jelenlegi állása szerint nem korrelálhatók általánosításokkal, vagy általánosabb törvényekből deduktívan levezethetők. jelentősége" *. J. Greenberg nem kevésbé bizonyossággal fejezi ki magát a nyelvi univerzáléknak szentelt gyűjtemény előszavában. L. Bloomfield híres szavaival polemizálva, miszerint „a nyelvre vonatkozó egyetlen legitim általánosítás az induktív általánosítás”, ezt írja: „Mindazonáltal általánosan elfogadottnak tűnik, hogy a tudományos módszernek nemcsak induktívnak kell lennie, hanem deduktív általánosításnak is Az induktív kutatással kapott elméleti hipotézisek születnek, amelyek alapján további általánosítások vonhatók le dedukcióval. Ezeket azután empirikus vizsgálatnak kell alávetni.

* ("Memorandum Concerning Language Universals," Universals of Language, szerk. J. Greenberg, Cambridge, Mass., 1963, p. 262-263.)

** („A nyelv univerzálisai”, p. IX.)

Az a tény, hogy a nyelvtudomány története nemcsak a nyelvi tények felhalmozódásából és osztályozásukból áll, hanem magával a nyelvvel kapcsolatos nézőpontok megváltozásából is, ami óhatatlanul a nyelvi tények eltérő megközelítését, sőt azok eltérő elméleti értelmezését vonja maga után, A szovjet nyelvészek egy részét arra kényszerítette, hogy tudományuk módszertani kettősségére vonatkozó következtetésekre jusson. S.K. Shaumyan azonban inkább a hipotetikus-deduktív módszerről beszél, és a következőképpen fejti ki jellemzőit: „A hipotetikus-deduktív módszer egy ciklikus eljárás, amely tényekkel kezdődik, és tényekkel végződik.

  1. magyarázatot igénylő tények rögzítése;
  2. hipotézisek felállítása e tények magyarázatára;
  3. a tények körén kívül eső tényekre vonatkozó előrejelzések hipotéziseiből való származtatás, hogy megmagyarázza, mely hipotéziseket terjesztették elő;
  4. a hipotézisek által előrejelzett tények tesztelése és a hipotézisek valószínűségének meghatározása.

A hipotetikus-deduktív módszer alapvetően különbözik az olyan tudásterületeken alkalmazott induktív módszertől, mint például a leíró botanika vagy az állattan." J. Greenberg például az induktív és a deduktív módszerek kombinációjáról beszél, majd S. K. Shaumyan felhívja a figyelmet. módszere hipotetikus-deduktív: a megnevezés egyértelműen inkonzisztens egy olyan módszer esetében, amely „tényekkel kezdődik és tényekkel végződik”.

* (S.K. Shaumyan, Az elméleti fonológia problémái, M., 1962, 18-19. A hipotetikus-deduktív módszerrel kapcsolatban lásd még V. S. Shvyrev „A tudományos ismeretek elméleti és empirikus szintje közötti kapcsolat logikai-módszertani elemzésének néhány kérdése” című cikkét a gyűjteményben. "A tudományos ismeretek logikájának problémái" (Moszkva, 1964), 66-75. oldal (a cikk 3. része).)

Azt a kérdést, hogy hova sorolandó a nyelvészet, I. I. Revzin is felteszi. „Természeténél fogva – válaszolja erre a kérdésre – a nyelvészetnek mindenekelőtt induktív módszereket kell alkalmaznia meghatározott nyelvek konkrét beszédaktusait írja le...

Másrészt a nyelvész által vizsgált végtelen számú beszédaktus jelenléte aligha teszi lehetővé a nyelvtudomány alapfogalmainak indukciós általánosítással történő megfogalmazását.

Ebből következik, hogy a nyelvészeknek nemcsak induktív, hanem deduktív kutatási módszerekre is szükségük van ahhoz, hogy olyan általános tudásrendszert alkossanak, amely segít megérteni az egyes nyelvek elemzéséből nyert adatokat...

Deduktív részében a nyelvészet látszólag ugyanúgy strukturálható, mint a logika vagy a matematika, nevezetesen: meghatározott minimális számú elsődleges, meghatározatlan kifejezést azonosítanak, és az összes többi kifejezést az elsődlegesen keresztül határozzák meg. Ugyanakkor néhány elsődleges állítást e kifejezések egymáshoz való kapcsolódásáról (axiómák) egyértelműen meg kell fogalmazni, és minden más állítást bizonyítani kell, azaz néhány más állításra redukálni kell." *.

* (I. I. Revzin, A nyelv modelljei, M., 1962, 7-8.)

Itt a dedukciós módszer, amelyet a logika és a matematika testesít meg, pusztán a „beszédaktusok halmazának” rendezésének eszközeként működik „általános fogalmak rendszerének” létrehozása céljából. Ezzel a feladattal egyenesen ellentmond azonban magának a deduktív módszernek a bemutatása, amelyet a nyelvtudományi használatra ajánlunk. Mind a cselekményekből, mind a tényekből teljesen átgondolt, és az általános nyelvi fogalomrendszer felépítésének kiindulópontjaként meghatározatlan és látszólag abszolút feltételhez kötött elsődleges terminusok halmazát veszi igénybe, amelyeken keresztül minden további terminus meghatározásra kerül.

Ez az ellentmondás nem véletlen, hanem az általunk vizsgált tudományok természetében rejlik. Úgy tűnik, hogy az a következtetés, hogy a nyelvi objektumok tanulmányozása során megengedhető az induktív és deduktív módszerek kombinációja, megnyitja a kaput a logikai és matematikai módszerek nyelvtudományi használatához, és ennek a következtetésnek a konkrét megvalósítása számos formális logikai és matematikai módszer létrehozása. nyelvi modellek. De amint az a következőkből kiderül, egy ilyen egyszerűsített megközelítés nem tud kielégítő eredményt adni. Abban egyetérthetünk, hogy a nyelvészeti kutatásban megengedett, sőt szükséges a deduktív és az induktív módszerek kombinálása. Végül, ahogy V. Brøndal írta, „az indukció nem más, mint egy álcázott dedukció, és a megfigyelt jelenségek között létrejött tiszta összefüggések mögött egy valóság, egy adott tudomány konkrét tárgya feltétlenül feltételezhető”. Ez azonban nem jelenti azt, hogy a logika és a matematika formális apparátusát feltétel nélkül és mechanikusan át kellene vinni a nyelvészetre, anélkül, hogy figyelembe vennénk „egy adott tudomány konkrét tárgyát”. Ugyanez I. I. Revzin helyesen megjegyzi, hogy „a deduktív úton szerzett bizonyítékok, bármennyire is kifogástalanok logikai szempontból, mégsem mondanak semmit a modell által leírt valódi nyelv tulajdonságairól”**. A modellek hatékonyságának meghatározásához pedig a gyakorlat felé fordulást javasolja, amelyet a gépi fordítás és a „nyelvészet egyéb gyakorlati alkalmazása” jelent.

* (B. Brøndal, Strukturális nyelvészet. Idézet a könyvből: V. A. Vegintsev, A nyelvészet története a 19. és 20. században. esszékben és kivonatokban, II. rész, M., 1965, 95. o.)

** (I. I. Revzin, A nyelv modelljei, M., 1962, 10. o.)

Az alkalmazott nyelvészet gyakorlata pedig azt mutatja, hogy a nyelvi jelenségek tanulmányozása során a matematikai és logikai módszerek alkalmazására nagyon szigorú korlátozások vonatkoznak.

3

A logika példát ad a deduktív módszer legkövetkezetesebb használatára. A matematika ebből a szempontból nagyrészt a logikát követi, ezért együtt is tekinthetők.

Természetesen mind a logika, sem a matematika nem reprezentál homogén rendszereket a módszereit és a célok értelmezését tekintve. Tehát például a logikával kapcsolatban beszélhetünk dialektikus, formális, matematikai logikáról és szűkebb értelemben objektív, szemantikai, fenomenológiai, transzcendentális, vagy konstruktív, kombinatorikus, poliszemantikus, modális stb. , el kell gondolkodni minden ilyen felosztástól, és csak a logikára és a matematikára mint egészre jellemző legáltalánosabb jellemzőkről kell beszélni, és főleg azokról, amelyek a legvilágosabban demonstrálják e tudományok módszereinek deduktív jellegét.

Ezt az álláspontot képviselve ezért nem fogunk induktív logikához folyamodni. Csak annyit jegyezzünk meg, hogy az induktív logika következtetéseit nem premisszák határozzák meg – tehát nem tautologikusak. Az induktív logikában a következtetések közvetlenül a tényektől függenek, ez utóbbiakat pedig tudásunk mennyisége határozza meg - tehát valószínűségi alapon állapítják meg. A valószínűségszámítás az induktív logika fő módszertani eszköze.

A deduktív logikát legteljesebben a formális és a matematikai logika képviseli, amelyekben sok a közös. A deduktív logika olyan tudomány, amely az emberi gondolkodást vagy mentális cselekedeteket szerkezetük vagy formájuk szempontjából vizsgálja, elvonatkoztatva azok konkrét tartalmától. A deduktív logika tehát olyan törvények és elvek megfogalmazására törekszik, amelyek betartása előfeltétele a valódi eredmények elérésének a következtetési tudás megszerzésének folyamatában. A deduktív logika fő módszertani eszköze az implikáció. Következtető tudáshoz jut a tapasztalat vagy gyakorlat közvetlen igénybevétele nélkül, csupán a logika törvényeinek alkalmazásával. A dedukció folyamatában az előfeltevés határozza meg a következtetést: ha a premissza igaz, akkor a következtetésnek igaznak kell lennie. Így a következtetés már benne van az előfeltevésben, a dedukció célja pedig az, hogy nyilvánvalóvá tegye azt, ami a premisszában már el van rejtve. Ebből az következik, hogy minden dedukcióval nyert következtetés tautologikus, azaz logikailag üres, bár más szempontból, például a formális logikai apparátus más tudományok céljaira történő alkalmazása esetén, előfordulhat. új, váratlan és eredeti.

Hasonló helyzet fordul elő a matematikában - az érvek érvényessége teljes mértékben a dedukción nyugszik. Sőt, a matematikában általában minden kezdeti nézőpont, egy problémamegoldás bármely megközelítése elfogadható - mindaddig, amíg eleget tesznek a matematikai dedukció feltételeinek. A matematika olyan „kezdeti nézőpontok” és „megközelítések” gazdag halmazával rendelkezik, amelyeket a kutató alternatív módon használhat problémái megoldására. A matematikai problémákat gyakran különböző ekvivalens formákra fordítják le, és mindegyik a matematikai elmélet különböző területeinek felhasználását jelenti a probléma megoldása érdekében. Így a matematikusnak gyakorlatilag korlátlan szabadsága van a premisszák megválasztásában – azokat választja ki, amelyek az ő szemszögéből a legígéretesebb lehetőségeket tartalmazzák a probléma legegyszerűbb, legnem triviálisabb, elegáns megoldására. Tehetsége és tapasztalata éppen a premisszák sikeres megválasztásában mutatkozik meg, azok a „tegyük fel, hogy...” vagy „ha... akkor”, amelyekkel tele vannak matematikai munkák. Akárcsak a logikában, a matematikai premisszák – axiómák vagy posztulátumok – határozzák meg a még nem definiált egységek definícióit.

A premisszák megválasztásának szabadsága a matematikában közvetlenül függ attól, hogy immateriális egységekkel vagy tárgyakkal operál - figyelme a köztük lévő kapcsolatokra irányul. A matematikai objektumok a tiszta relációk szerkezetét kifejező szimbólumokként szolgálnak. A matematikai rendszer tehát olyan formális viszonyok halmazának tekinthető, amelyek csak ezen relációk kijelentései révén léteznek. Természetesen, különösen az alkalmazott célokra, a relációkijelentések törekedhetnek a külső valósággal való megfelelés megtestesítésére, de ez semmilyen módon nem érinti magukat a relációkijelentéseket, hanem éppen ellenkezőleg. A matematikusok nem kutatják axiómáik „igazságát”, noha kölcsönös következetességet követelnek közöttük. A matematikai rendszeren belüli kutatás olyan összefüggések vizsgálata és megállapítása, amelyek lehetővé teszik annak bizonyítását, hogy az A elmélet ténye feltételezi a B elmélet tényét. Ebből következően a matematikában nem az a fő kérdés, hogy „mi az A és B?”, hanem „A feltételezi (vagy feltétele) B-t?”.

Teljesen más a helyzet a nyelvészetben. Főleg az első kérdésre összpontosít, és ez nem ad lehetőséget arra, hogy elszakadjon a valóságtól; ezért nem elvont, hanem konkrét egységekkel operál, bár bizonyos esetekben absztrakt objektumok létrehozására törekszik, mint például a fonéma vagy a morféma fogalma. Ez a helyzet nemcsak a hagyományos nyelvészetre jellemző, hanem annak legújabb, a strukturalizmus zászlaja alatt egyesülő irányaira is. Fentebb már számos olyan állítást idéztünk, amelyek bár igyekeztek nem csak induktív, hanem deduktív módszereket (vagy matematikai és logikai módszereket) is alkalmazni a nyelvtudományban, mégsem tudták megkerülni a valódi nyelvi tény kezelésének szükségességét. Rajtuk kívül még egyet idézhetünk, ami teljes világosságot ad a vizsgált kérdésben: „A nyelvi elemzés – írja ezzel kapcsolatban P. Garvin – alapvetően induktív folyamat abban az értelemben, hogy egy listát kíván felállítani. Az adatközlők nyelvi ingerein vagy a szöveg tanulmányozásán alapuló elemek vagy állítások halmaza azon a feltételezésen alapul, hogy mindkét információforrásban fel lehet ismerni a rendszeresen előforduló különböző típusú elemeket. és bonyolultsági sorrendek Az elemzés eredményeként kapott osztályozás és eloszlási feltételeik megállapítása induktív leírást alkot" * .

* (P. Garvin, A Study of Induktív Method in Syntax, "Word", vol. 18 (1962), p. 107,)

A nyelvészetben természetesen használhatjuk a premisszák módszerét is, amelyek alapján azután meghatározott objektumokat, tényeket vagy nyelvegységeket határoznak meg. Itt azonban két olyan jellemzővel állunk szemben, amelyek jelentősen módosítják ennek a módszernek a használatát. Ellentétben a logikával és a matematikával, ebben az esetben az így kapott definíciók „igazságát”, azaz a tapasztalati adatoknak való megfelelését kell keresni. Így az előfeltevés és a következtetési tudás kölcsönös függése létrejön: az előfeltevés határozza meg a következtetést (egy adott nyelvi objektum definícióját az előfeltevés szempontjából), de ha a következtetés nem felel meg a tapasztalati adatoknak, akkor létezik egy ki kell igazítani magát a premisszát. De a premisszának ez a fajta kiigazítása semmi köze az ekvivalens formákra való lefordíthatósághoz, ami, mint fentebb jeleztük, a matematikában megengedett, mivel nem formális megfontolások, hanem kísérleti adatok határozzák meg. A fentiek mindegyike okot ad arra a következtetésre, hogy maga a premissza fogalma és a választás szabadsága olyan sajátosságokkal bír a nyelvi elemzésben, amelyet nem lehet figyelmen kívül hagyni a nyelvtudományi deduktív módszer alkalmazásakor.

A nyelvészek nem használhatják olyan szabadon a "ha" vagy a "mondjuk" módszert, mint a matematikusok. Az előfeltételek szabadsága nagyon szigorúan korlátozott. A nyelvtudomány története számos „szempont” változást ismer, vagy más szóval kezdeti premisszákat, amelyeket új tények felfedezése, az általános tudományos eszmék nyelvtudományba való elterjedése, vagy akár az eredetiek kialakulása váltott ki. elméletek. De a nyelvész számára minden ilyen esetben a „ha” vagy a kezdeti premissza változása az egész tudományos koncepció változását jelenti. Ezért a nyelvész nem azt mondja, hogy „ha”, hanem feltételezi, hogy megérti az előfeltevést, vagyis tulajdonképpen a kutatás tárgyának megértését, és ennek alapján definiálja a nyelv egyes egységeit, e meghatározások „igazságát” a tapasztalati adatokkal ellenőrizve. Ez utóbbi körülmény a premissza és a konklúzió egymásrautaltsága miatt a nyelvészetben eszközül szolgál magának a premisszának az ellenőrzésére és érvényesítésére, amely a nyelvi elemzés deduktív formájának kezdetén áll. Tehát, ha arra fordulsz konkrét példák, a múltban a nyelvet természetes organizmusként (Schleicher), egyéni pszichofiziológiai tevékenységként (neogrammaristák) értelmezték, stb. Az e fogalmakon alapuló kutatási gyakorlat elégtelenségüket mutatta. Napjainkban a nyelvi elemzés kiinduló tétele az a posztulátum, amely szerint a nyelv jelrendszer *. Ugyanolyan tapasztalati és gyakorlati próbának van alávetve, mint a nyelvtudomány bármely más fogalma.

* (Lásd: Paul Garvin, The Definitive Model of Language. In: Természetes nyelv és a számítógép, szerk. P. L. Garvin, New York, 1964.)

Már ezek az előzetes és a legáltalánosabb megfontolások is azt mutatják, hogy a deduktív módszerek a nyelvészetben egyáltalán nem ellenjavalltok, de használatuk meghatározott feltételek betartását igényli. Ezek a sajátos feltételek korlátozzák a logikai és matematikai módszerek mechanikus átvitelét a nyelvtudomány területére. Ha azonban egy ilyen általános kijelentésre szorítkozunk, sok minden továbbra is tisztázatlan marad. Éppen ezért szükséges az általunk vizsgált kérdéskör elmélyítése, és a lehetséges következtetések megerősítéseként az alkalmazott nyelvészet gyakorlata felé fordulni, ahol a premisszák legitimitása és az ezek alapján levont következtetések megfeleltetése a kísérleti adatokkal a legnagyobb. egyértelműen kimutatták.

4

A nyelv és a logika kapcsolata nagyon sajátos. Az empirikus tudományok, köztük a nyelvészet képviselői egy adott tárgyat vagy jelenséget tanulmányoznak annak leírása vagy magyarázata érdekében. A kapott eredményeket tárgynyelvnek nevezett nyelven fogalmazzák meg. A logikus bizonyítékokat, következtetéseket, ítéleteket stb. használ, de ezek csak nyelvi formában állnak rendelkezésére. Így kiderül, hogy a logikus egy lépéssel távolabb van a való világtól, mint az empirikus tudományok képviselői. Elemzése nem közvetlenül az empirikus tudományok által vizsgált valós tárgyra irányul, hanem azok nyelvére *. Vagyis a nyelvet vizsgálja és a kapott eredményeket egy metanyelvnek nevezett nyelven fogalmazza meg.

* („A tudományos ismeretek logikai elemzése – írja ezzel kapcsolatban P. V. Tavanets és V. S. Shvyrev – mindenekelőtt és közvetlenül annak a nyelvnek az elemzése, amelyen ez a tudás kifejeződik. Lásd a gyűjtemény „The Logic of Scientific Knowledge” című cikkét. "A tudományos tudás logikájának problémái", M., 1964, 161. o)

Logikai szempontból a nyelv alapegysége nem a jel vagy az általa jelölt tárgy, hanem egy mondat, hiszen csak ebben bontakozhat ki a logikai folyamat. Éppen ezért csak egy mondat lehet igaz vagy hamis. De maguk a szavak nem rendelkeznek ezekkel a tulajdonságokkal. Mielőtt azonban megállapíthatnánk, hogy egy mondat igaz-e vagy sem, ki kell jelentenünk, hogy van jelentése.

Az igazság és a jelentés fogalma a szemantika területéhez tartozik. Ezeken az összefüggéseken keresztül határozható meg egy mondat igazsága vagy hamissága: ha a mondat helyesen ír le tárgyakat, akkor igaz, ha pedig helytelen, akkor nem. A nyelvi kifejezések azonban az általuk jelölt objektumok között létezőtől eltérő kapcsolatokba léphetnek. Ezenkívül a mondatok kapcsolatba léphetnek más mondatokkal. A logikus feladata a nyelvi kifejezések és mondatok közötti kapcsolatok természetének feltárása, valamint szabályok felállítása annak meghatározására, hogy az adott esetben előírt eljárást betartják-e vagy sem. Az utolsó kérdés megoldása során a logika nem a mondat által leírt tárgyakhoz fordul. A nyelvi forma érdekli, és nem a tartalma, ami természetesen nem akadályozza annak értelmes értelmezését, ami egy formalizált nyelv kialakulását eredményezi. A formalizált nyelv absztrakt rendszerként, például predikátumszámításként ábrázolható.

Tehát a logika a tanulmány célkitűzéseitől függően két szinten dolgozhat - szintaktikai (logikai szintaxis) és szemantikai (logikai szemantika). Nézzük először e szintek közül az elsőnek a természetes nyelvre való alkalmazását.

Míg a nyelvi formák és a közöttük fennálló kapcsolatok tanulmányozásával foglalkozó logikus a szintaktikai szinten maradhat, nem szubsztantív módon tevékenykedik, addig a nyelvész ezt nem teheti meg. A természetes nyelv minden szintje (talán a fonéma kivételével) értelmes, ezért a szemantikán kívül elképzelhetetlen. S ráadásul a természetes nyelv nem létezik a pragmatikán kívül, amely nem választható el tőle könnyen azon egyszerű oknál fogva, hogy a beszédaktusban folyamatosan szemantikává transzpolálódik. Ezért a természetes nyelv mindig értelmezés, ráadásul kétlépcsős, mivel mind a szemantikához, mind a pragmatikához kapcsolódik *. Ez az értelmezés pedig még semmilyen formalizálásra nem alkalmas.

* (Házasodik. Niels Bohr megjegyzései a matematikai nyelvről, ahol „az objektív leíráshoz szükséges definíciók egyértelműségét éppen azért érjük el matematikai szimbólumok használatával, mert így elkerüljük a tudatos szubjektumra való hivatkozásokat, amelyek áthatják a mindennapi nyelvet” (Neales Bohr, Atomfizika és Human Cognition, M., 1961, 96. o.).)

Térjünk most át a második szintre, amikor az értelmezést szemantikai szabályokon keresztül tulajdonítják a kalkulusnak. És ebben az esetben olyan oktatásban részesülünk, amely semmiképpen sem hasonlítható a természetes nyelvhez. Igaz, itt értelmes kifejezésekkel van dolgunk, de logikus és természetes nyelven egészen más alapokra építik az „igazsághoz” való viszonyukat. Ahogy A. Tarski írja, az „igaz”, „klasszikus értelmezésében mindenesetre” annyiban van, hogy „egybeesik a valósággal” *. De az „igazságnak” ez a kritériuma valójában csak a természetes nyelvekre vonatkozik, amelyek mindig valóságorientáltak. Más a helyzet a logikai szemantikában. A szemantikai elemzés csak a rendszer logikai értelmezésére támaszkodik, és magában foglalja az igazság feltételeit megfogalmazó bizonyos szabályok felállítását. Következményt ír elő ezeknek a szabályoknak, anélkül, hogy választ adna arra a kérdésre, hogy mennyiben van itt „egybeesés a valósággal”. Ezenkívül a valóságra való összpontosítás a természetes nyelven nem közvetlenül, hanem egy személyen keresztül történik, ami ismét szükségessé teszi a harmadik szintre - a pragmatikusra - fordulást. „A szemantikai szintre való átmenet – állítja P. V. Tavanets és V. S. Shvyrev – önmagában nem visszatérés egy élő nyelvhez a maga konkrétságában, ahogyan első pillantásra tűnhet, mivel a nyelv szemantikai funkciója úgy tűnik. a nyelv mint „a gondolat közvetlen valósága” lényegére Valójában a „nyelv – valóság” szemantika eredeti sémája még nem ad konkrét képet a nyelvről, mint a gondolkodás közvetlen valóságáról, azon egyszerű okból, hogy a nyelv összefügg. a valósággal nem önmagában valami misztikus módon, hanem az emberen, cselekedetén, viselkedésén keresztül, ezért szigorúan véve a nyelv mint gondolathordozó sajátos elképzelése csak a pragmatikus elemzés szintjén érhető el. a „nyelv – emberi cselekvések nyelvvel és nyelv alapján – valóság” séma szerint **.

* (A. Tarski, Grundlegung der Wissenschaftlichen Semantik. "Actes du Congres International de Philosophie Scientique", 1936.)

* (Lásd a gyűjtemény „The Logic of Scientific Knowledge” című cikkét. "A tudományos tudás logikájának problémái" (Moszkva, 1964, 16. o.).)

De ez még nem minden. A vizsgált kérdéssel kapcsolatban V. M. Glushkov ezt írja: „Az élő emberi nyelv csak akkor tekinthető formális nyelvnek, ha olyan szigorú szabályrendszert fogalmaztak meg, amely lehetővé teszi a nyelvben elfogadható kifejezések megkülönböztetését az összes többi kifejezéstől, azaz , értelmes mondatok az értelmetlenektől.” * . A természetes nyelv formalizálása során felmerülő nehézségeket kifejtve rámutat arra is, hogy „egy fix formalizált nyelv sem lehet adekvát egy élő emberi nyelvnek, mivel az utóbbi az elsőtől eltérően folyamatosan fejlődik és fejlődik Az élő emberi nyelvnek csak az azonnali szereposztása válik többé-kevésbé sikeressé, amely elveszti hasonlóságát az eredetihez, ahogy az utóbbi fejlődik." ** . Ha minden csak ezen múlna, akkor nem lenne olyan rossz. Az alkalmazott nyelvészetben a nyelvfejlődés mozzanatain gondolkodnak, törekednek arra, hogy teljesen stabil rendszernek tekintsék, de mégsem sikerül elérniük a természetes nyelv formalizálását. Ez egy nagyon egyszerű okból történik. A formális rendszer és a természetes nyelv ellentétes tulajdonságokra alapozza hatékonyságát. Bármely formális rendszer mindig azonos önmagával. Ez a minőség teszi lehetővé, hogy minden konkrét alkalmazási esetben elláthassa funkcióját. A természetes nyelv pedig - tartalmát, szemantikáját, vagy ahogy ezekben az esetekben szokták mondani, tájékoztató fogalmait tekintve - soha nem azonos önmagával. Ez a képesség teszi lehetővé a működést minden konkrét alkalmazási esetben. Bár ugyanaz a nyelv marad, a különböző helyzetekben mindig más. Ugyanakkor nincsenek sem kifejezett, sem formáló szabályai, sem az „igazság” szabályai, sem transzformációs szabályai annak meghatározására, hogy egy adott szó melyik lehetséges jelentést vagy jelentésárnyalatot kapja meg egy adott helyzetben. Sőt, a természetes nyelvben szinte bármely szó olyan jelentést kaphat, amelyet egyetlen nyelv sem rögzít - keletkezés után megrögzülhet a nyelvben, de ugyanolyan sikerrel, mint egy elszabadult fény, fellobbanhat, eltévedhet. a nyelvi „teret” és kimenni. Mindezekkel a tulajdonságokkal a természetes nyelv elképesztően tökéletes eszköznek bizonyul, amely lehetővé teszi a teljes kölcsönös megértést a legbonyolultabb fogalmakkal kapcsolatban, és bármilyen helyzetben. Miért történik ez?

* (V. M. Glushkov, Gondolkodás és kibernetika, "A filozófia kérdései", 1963, 1. szám, 37-38.)

** (V. M. Glushkov, Gondolkodás és kibernetika, "A filozófia kérdései", 1963, 1. szám, 38. o.)

Úgy tűnik, a választ erre a kérdésre részben a szemiotika megalapítójának, Charles Peirce-nek egy gondolatában kell keresni, amelyet számos művében kitartóan ismétel. Így is lehet értelmezni. A modern nyelvészetben a nyelvet általában jelrendszerként határozzák meg. Ez minden nyelvi elemzés kiindulópontja. Ha ez így van, akkor a nyelv nem csupán jelrendszer, hanem a nyelvben létező, kölcsönösen értelmező jelek rendszere, amennyiben azokat más jelekben értelmezik. C. Peirce ezt a következőképpen fogalmazza meg: „Egy jel sem funkcionálhat jelként, hacsak nem értelmezik egy másik jelben. És máshol: „Egy jelnek az a célja, hogy egy másik jelben értelmezzék”**. És talán a legfontosabb: „Egy jel nem jel, hacsak nem alakul át egy másik jellé, amelyben teljesebb fejlődést kap” ***.

* (Ch. Peirce, Collected Papers, Cambridge, Mass., vol. 8. §. 225.)

** (Ott e, §. 191.)

*** (Ch. Peirce, Collected Papers, Cambridge, Mass., vol. 5., 594. §.)

Következésképpen a természetes nyelv olyan jelrendszer, amely kölcsönös értelmezés révén képes minden emberi szükségletre a szemantikai kifejezésben válaszolni. De itt egy lényeges figyelmeztetés szükséges. Végül is minden ilyen igényt az embernek a külső világ jelenségeihez és a társadalmi környezethez való hozzáállása határoz meg, amelyben az élete zajlik. Ebből a körülményből adódóan a transzformációs szemantika, ha létrejöhetne, nem támaszkodhat csak a jelek kölcsönös értelmezésének szabályaira, és nem lehet zárt és véges jellegű. Kiderül, hogy nagyon sok olyan mennyiség származéka, amelyek erősen ellenállnak a formalizálásnak *.

* (P. Jacobson ezzel kapcsolatban kijelenti: „Tisztán nyelvi szemantikát konstruálhatunk, ha elfogadjuk Peirce álláspontját, miszerint minden egyes nyelvi jelnek az a lényegi jellemzője, hogy lefordítható egy másik nyelvi jellel, részletesebben, kifejezettebben, vagy fordítva. , az azonos vagy más nyelvi rendszer elliptikusabb jele Ennek a fordíthatóságnak köszönhető, hogy feltárulnak azok a szemantikai invariánsok, amelyeket a jelzőben keresünk, így lehetőség nyílik a nyelv szemantikai problémáinak megoldására is a disztributív elemzés" (beszéd az 1. International. Symposium "Sign in the language system", Erfurt, NDK, 1959). Idézet a könyvből: V. A. Vegintsev, A 19. - 20. századi nyelvészet története esszékben és kivonatokban, 2. rész, M., 1965, 398. o.

A fentiekkel összefüggésben fontos figyelembe venni egyrészt a problémamegoldási eljárás sajátosságait és magát a determináció fogalmát a logikában és a matematikában, másrészt a nyelvészetben.

Mielőtt egy feladat matematikailag megoldható lenne, pontosan meg kell fogalmazni - ez a megfogalmazás a probléma sikeres megoldásának előfeltétele. Ugyanakkor, mint már jeleztük, a matematikus szabadon átalakíthatja egy probléma adott megfogalmazását egy ekvivalens változatba - a matematika rendelkezik erre a megfelelő eszközökkel. A nyelvészet már a kutatásmódszertannak ebben a kezdeti szakaszában jelentősen eltér a matematikától. A nyelvész problémái megfogalmazásakor bizonyos mennyiségű megfigyelt empirikus adattal rendelkezik, amelyeket nem mindig tud pontosan megfogalmazni, de ennek ellenére akarva-akaratlanul is kutatásának alapját kell képeznie, már ennek folyamatában. maga a kutatás. Annak érdekében, hogy ne menjen messzire a példákkal, hivatkozhat a nyelvi jelentése, amely minden munka alapját képezi a beszédinformációk automatikus feldolgozása terén, ugyanakkor nagyon homályosan és következetlenül van meghatározva. Ez a körülmény kényszeríti a terület kutatóit arra, hogy folyamatosan változtassák stratégiájukat.

Most azonban elkezdődött a kutatás, és megszületett a döntés. Mit jelent ez a logikával és a matematikával, illetve a nyelvészettel kapcsolatban? A logika, mint fentebb említettük, lehetővé teszi az előfeltevésben implicit következtetések explicit bemutatását, de nincsenek olyan szabályai, amelyek használata garantálhatná a kívánt megoldás elérését, mivel nem eszköz új elérésére. következtetéseket, hanem csak a helyességüket meghatározó technikát. Nem ő a mágikus kulcs minden rejtélyhez. Teljesen nyilvánvaló, hogy ha a logikának ilyen szabályai lennének, akkor nem lennének megoldatlan problémák. Elég lenne egy bizonyos logikai szabályrendszert alkalmazni, és minden minket gyötrő kérdésre automatikusan kész választ kapnánk. A fentiek tükrében a probléma, feladat megoldásának fogalma is sajátos jelentést nyer.

A logikában és a matematikában minden végeredmény igaznak minősül, ha a bizonyítási folyamat során semmilyen formális szabályt nem sértettek meg. Mivel különböző bizonyítási módok lehetségesek, különböző megoldások létezése megengedett. De ezek mindegyike igazolható a logika vagy a matematika követelményei szempontjából. A nyelvészetben más a helyzet. Nincs olyan apparátusa, amellyel ellenőrizni, vagy bizonyítani lehetne a levont következtetések helyességét. Ennek megfelelően az elért megoldások igazságát meghatározzák - nem formális szabályok határozzák meg, hanem a tapasztalati adatoknak való megfelelés. Ilyen körülmények között elméletileg egyetlen végső megoldást várnánk. A gyakorlatban azonban – amint azt a nyelv alapkategóriáinak egymásnak ellentmondó nyelvi meghatározásai is bizonyítják – ez nem valósul meg. Az értékelések bizonyos szubjektivitása ebben az esetben mindig jelen van, és ezt bizonyos mértékig meghatározza a kutató rendelkezésére álló tények mennyisége (és természetesen azok jellege). Ebből következik, hogy egy megoldás „igazsága” a nyelvészetben mindig valamilyen közelítésben van megadva, és nem meghatározó jellegű, hanem valószínűségi.

Ilyen körülmények között nagyon fontos, hogy a nyelvi definíciók és értelmezések helyességét objektív kritériumok alapján ellenőrizzük. Az ilyen ellenőrzés lehetőségét az alkalmazott nyelvészet széles területe biztosítja, ahol a természetes nyelvet egy gép állítja szembe, amely ebben az ellentétben a logika és a matematika érdekeit képviseli.

5

Az alkalmazott nyelvészet gyakorlati problémáinak megoldására digitális számítógépet használnak. Képes információkat észlelni, tárolni, továbbítani, átcsoportosítani és kiadni. Értelmez és végrehajt egy parancskészletet (parancsprogramot), és egy feladat végrehajtása során módosítja is azokat. Nagyon összetett problémákat képes megoldani, ugyanakkor a feladatról a megoldásra való átmenet teljes folyamatát kimerítően és következetesen le kell írni az alapvető elemi műveletek sorozatával. Az információk kétjegyű (bináris) kóddal vagy nyelvvel kerülnek be a gépbe. A gép az ilyen módon kódolt szavakkal működik, amelyek megfelelnek a propozíciós vagy állítmányszámítás alapvető logikai összefüggéseinek vagy funkcióinak. Egy gép pontosan azért tud bonyolult matematikai problémákat megoldani, mert az összetett matematikai műveletek aritmetikai műveletek sorozatává redukálhatók, ez utóbbiak pedig logikai műveletekké. Ezért a digitális számítógép logikai gépnek tekinthető.

Így bármilyen összetett is a probléma, a gép azt elemi műveletsor segítségével oldja meg, melynek programját abszolút egyértelműen (konzisztensen), pontosan, részletesen és kimerítően kell megfogalmazni. Más szóval, nem lépheti túl a propozíciószámítás által szabott határokat, és amikor azt kérdezzük, hogy egy gép képes-e megbirkózni a természetes nyelvekben található információk feldolgozásával, először azt kell kiderítenünk, hogy a propozíciószámítás mennyire megfelelő modell. a természetes nyelvhez.

Tekintettel a digitális számítógép fentebb leírt sajátosságaira, az első dolog, amit meg kell tenni ahhoz, hogy a gép „megértse” a feladatot, és megkezdje a beszédinformáció ennek a feladatnak megfelelő feldolgozását, az az, hogy a természetes nyelvben található információkat újrafogalmazzuk logikai nyelvre. A dolog tehát arról szól, hogy a természetes nyelvet lefordítsuk a logikai propozicionális kalkulus nyelvére. Ugyanakkor, amint azt Bar-Hillel* megmutatta, olyan nehézségekkel kell szembenézni, amelyek az automatikus feldolgozás kilátásait nagyon komor színben tüntetik fel, hacsak a probléma megoldásának keresésének egész iránya nem változik meg. Legalább a következő akadályokkal kell számolnunk, amelyek leküzdéséhez még nem áll rendelkezésünkre a szükséges eszköz.

* (Y. Bar-Hillel, A teljesen automatikus, jó minőségű fordítás nem megvalósíthatóságának demonstrációja, "Advances in Computers:", vol. 1, New York, 1960, pp. 158-163.)

V. Az állítások logikai számítása túl szegényes ahhoz, hogy még távoli közelítéssel is lehetséges legyen egy természetes nyelv újrafogalmazása, amely szemantikai szerkezetében hihetetlenül összetett, rengeteg redundáns elemet tartalmaz, és ami a legfontosabb, gyakran olyan kétértelműség és bizonytalanság jellemzi a "jelentés" kifejezésben, hogy egyetlen kétértékű logika sem képes megbirkózni a természetes nyelv mesterséges kettősének létrehozásával *. Igaz, a logika, mint megjegyeztük, csak a nyelvi formával foglalkozik. De mivel automatikus információfeldolgozásról beszélünk, meg kell tudni különböztetni a szemantikai információkat, és ha ez a rendelkezésünkre álló logikai eszközökkel nem érhető el, akkor hogyan nyerhetünk meggyőződést, hogy a természetes nyelvet logikaira fordítjuk. helyes?

* (Ch. Hockett „Grammar for the Hearer” című cikke számos példát ad a mondatok „természetes” megértésének ilyen bonyolultságára, amelyeket az elemzés későbbi és messzemenő lépései oldanak meg (Ch, Hockett, Grammar for the Hearer, "A nyelv szerkezete és matematikai vonatkozásai", Providence, 1961, 220-236.)

B. A gép nem tudja figyelembe venni azt, amit Bar-Hillel „információ általános hátterének” nevez, ami valójában kívül esik a természetes nyelv határain, ezért nem fordítható le logikai nyelvre. Ezekben az esetekben a nyelvészek olyan vonatkoztatási keretről beszélnek, amely általunk észrevétlenül, de nagyon határozottan minden szavunkat kijavítja, vagy akár teljesen újragondolja. Hiszen még egy olyan egyszerű kifejezés is, mint „sötétedés előtt visszatérek”, annak pontos megértéséhez és a benne foglalt időjelzés meghatározásához legalább előzetes ismeretet igényel, hogy mikor, hol hangzott el és mikor. év. Csak ez a fajta előzetes információ az egyetlen eszköz azoknak a kifejezésen belüli relációknak a megértésére, amelyekkel sem a propozíciós, sem a predikátumkalkulus nem tud megbirkózni. Tehát, például két mondatot, ami felvillant az újságokban:

Egyetemi végzős hallgató Kurszkból;

Szibéria tisztelt újítója, -

látjuk, hogy mindegyik kétféleképpen értelmezhető. Ha csak a formális nyelvtani sajátosságokhoz ragaszkodunk, akkor az első mondat egyformán érthető így: „Kurszk városában található egyetem végzős hallgatója” és „Kurszk városában élő egyetem végzős hallgatója (vagy Kurszk városából származik). A második mondat pedig úgy is értelmezhető, hogy „Tisztelt újító, akinek tevékenységi területe Szibéria”, és úgy is, mint „Tisztelt újító, aki Szibériában lakik”. És csak előzetes tudás (előzetes információ), amelyet semmilyen módon nem fejeznek ki mondatokban, és kijelentik, hogy Kurszk városában nincs egyetem, és van egy „tisztelt újító” tiszteletbeli cím, amelyeket a Szovjetunióban az egyes közigazgatási körzetek jelöltek ki, lehetővé teszik e javaslatok helyes megértését. Ha jól megnézzük, a beszélt nyelv szinte minden mondata mögött nagyon alapos és szerteágazó előzetes információ húzódik meg, ami egy ember számára magától értetődő, de túlmutat egy sem klánt, sem törzset nem ismerő gépezet „megértésén”.

B. A gép nem tud olyan intratextuális szemantikai következtetéseket levonni, amelyek több mondatra kiterjednek (sőt néha szándékosan egy egész történetre is, hogy ne fedje fel teljesen annak karakterét vagy cselekményfejlődését). Erre a körülményre A. Reichling holland nyelvész * hívta fel a figyelmet, elképzelését a következő példával illusztrálva. Tegyük fel, hogy egy történetet olvasunk, amely a következő mondattal kezdődik: „Játszom a bátyámmal”. Ha itt megállunk, akkor semmilyen adat nem áll majd a rendelkezésünkre, hogy megtudjuk, hogyan kell ezt a kifejezést érteni, milyen játékról van itt szó. Elvégre játszhatsz pénzért (kártya stb.), hangszeren, színházban vagy moziban, játékokkal, focizhatsz, játszhatsz szórakozásból, játszhatsz az emberrel és a sorsával stb. tovább olvassuk: "Ezt akkor mondtam, amikor Wilhelm egy nap találkozott velem egy bárban." Most valószínűbb, hogy arra a következtetésre juthatunk, hogy úgy tűnik, pénzért való játékról beszélünk. De vannak még más lehetőségek is. Így folytatódik: „A bátyám odajött az asztalhoz, és eldobták a kockákat.” Mára már világos, hogy milyen játékról van szó, bár a szövegben sehol sem volt pontosan feltüntetve a „játék” szó tényleges jelentése. A szövegben különböző mondatokban megadott külső jelek összességéből sejtettük. Ezek a jelek itt egymás után következnek, de egy írott narratívában jelentősen elkülönülhetnek egymástól. Az ember széles nyelvi kontextusból kiválaszthatja őket (jelen esetben ezzel van dolgunk), összehasonlíthatja őket, majd levonhatja a megfelelő következtetést. A gépet megfosztják ettől a lehetőségtől.

* (A Stichting Studiecentrum voor Administrative Automatisering által 1961-ben szervezett kollokviumon. A jelentésnek német fordítása is van: A. Reichling, Moglichkeiten und Grenzen der mechanischen Ubersetzung, aus der Sicht des Linguisten, „Beitrage zur Sprachkunde und Informationsverarbeitung”, Heft 1, Wifcn, 1963.)

De lehet, hogy neki ez nem kell? Valójában nincs különösebb nehézség, ha ezeket a mondatokat gépi fordítással németre vagy franciára fordítjuk (de természetesen nehézségek adódhatnak más mondatok fordításakor). Németre fordításkor használhatjuk a szó szerinti szóhasználatot: Ich spile mit meinem Bruder. Ugyanígy franciául kezdhetjük: Je joue avec... Már angolra fordításkor nyelvtani nehézségek adódnak, hiszen az adott szövegben nincs utalás arra, hogy melyik formát válassza a gép: 1. Játszom vele bátyám, 2. Játszom a bátyámmal vagy 3. Játszom a bátyámmal? És spanyolra fordítva nagyon rosszul sül ki, mivel a gépnek legalább három ige közül kell választania: jugar, tocar vagy trabajar .

Itt a logikai nyelv tehetetlen.

D. A gép tulajdonképpen a beszéddel (vagy pontosabban a beszédrészletekkel) foglalkozik - annak írott és szóbeli formájában. Mindegyik beszédformának megvan a maga pragmatikai elemrendszere, amely szemantikai elemekké is átalakulhat (és az ilyen átmenet szabályait nem tanulmányozták, és jórészt önkényesek). Például a szóbeli beszédnek van egy olyan szupraszegmentális felépítménye, mint az intonáció. Ma már lehetségesnek tűnik az intonáció funkcionális típusok szerinti osztályozása, valamint a kérdő, narratív és egyéb intonációk megkülönböztetése. Az azonban teljesen vitathatatlan, hogy az intonáció nem létezik mondatoktól függetlenül; természetesen kölcsönhatásba lép a bennük rejlő jelentéssel. Ennek alátámasztására elegendő egy retorikai kérdésre hivatkozni, amely csak külső szerkezetében kérdés, de jelentésében nem kérdés: nem kíván választ a hallgatóktól. Így egy újfajta nehézség adódik, amellyel egy logikai nyelv nem tud megbirkózni.

D. A beszédinformációk automatikus feldolgozásának módszere (és különösen a gépi fordítás) azon a feltételezésen alapul, hogy bármely mondatot és a nyelv egészét bizonyos számú elemi szemantikai egységbe (szavakba) „elemzik”, ahonnan aztán lehetséges bizonyos szabályokat adott mondatokat "összegyűjteni". Ennek a feltevésnek a következménye egy másik, miszerint egy mondat jelentése az alkotó szavai jelentéseinek számtani összege. Itt a matematikát veszik modellnek, ahol a számítógép által végrehajtott legbonyolultabb műveletek végső soron rendkívül elemiekké redukálódnak. De a nyelvben szinte teljesen ellentétes képpel állunk szemben. A lényeg nem csak az, hogy a különböző nyelveken a mondatokat szemantikailag eltérően „bontják szét”. Például:

A lány sétál. A lány áll. A sapka jól áll a lánynak. Das Madchen geht. Das Madchen steht. Der Hut steht dem Madchen(szó szerint: A kalap a lánynak kerül).

A lényeg az is, hogy még ugyanazon a nyelven belül sem figyelhető meg a legtöbbször számtanilag helyes összefüggés a mondat jelentése és az azt alkotó szavak jelentése (jelentése) között. Ebből az alkalomból E. Benveniste ezt írja: „A mondat a szavakon keresztül valósul meg az összetevők teljes halmazán” *. Nem idiomatikus kifejezésekről beszélünk (például: „hanyagul csinálom”, „valakinek a szemüvegét dörzsöli” stb.), hanem a leghétköznapibb mondatokról. Vegyünk egy egyszerű példát:

Várjon! - Elmegyek színházba.

Lehet-e vitatkozni, hogy ennek a mondatnak a jelentése a szavak jelentésének számtani összege: várj, menj, színház, én, be? Egy ilyen aritmetikai ábrázolás alapján azt várnánk, hogy ezeknek a szavaknak a nyelvtanilag helyes mondatban bemutatott bármilyen kombinációja ugyanazt a jelentést megtartja - a kifejezések helyének átrendezése ugyanis nem változtat a kifejezések összegén. De próbáljuk meg kissé módosítani ezt a javaslatot:

Színházba megyek – várj!

Látjuk, hogy jelentésében ez a második mondat jelentősen eltér az elsőtől.

* (E. Benveniste, Les niveaux de G analiz linguistique, "Preprints of Papers for the Ninth International Congress of Linguists", Cambridge, Mass., 1962, p. 497)

Ez az egyik rendkívül elemi példa, és ha a bonyolultabbak felé fordulunk, akkor különösen nyilvánvalóvá válik minden olyan átalakítási szabály tehetetlensége, amely ilyen esetekben irányadó lenne. Nem is lehet másként: egy mondat ugyanis monoszemémák sorozata, a monoszeméma (lásd a „Szemantikai kutatások rendszere”), mint szintaktikai konfiguráció, nagyobb, mint egy szó. Ez a körülmény oda vezet, hogy a mondat, mint monoszémek sorozata, egymást kölcsönösen meghatározó elemek sorozata, amelyek szemantikai értelemben egy megszakíthatatlan láncban kapcsolódnak egymáshoz, amely sematikusan és erősen általánosított formában a következőképpen lehet *:

* (Lásd a „Függeléket” a könyv végén.)

Éppen a mondatok ezen sajátosságai miatt van minőségi különbség az utóbbi és a szavak között. Ha a szavak jelként definiálhatók, akkor a mondatok kétségtelenül túlmutatnak a jelszinten.

A nyelv és a mondatok „felbonthatóságának” kérdése egy általánosabb kérdésen nyugszik. Vannak olyan szerkezetek, amelyek csak összetett összetételükben tudják ellátni funkcióikat. Amikor megpróbáljuk kisebb részekre bontani vagy elemibb struktúrákra redukálni őket, valójában szétesnek, megszűnnek létezni, és elvesztik összetett összetételükben rejlő tulajdonságokat. Ez a nyelv. V. Humboldt megértette ezt (a kérdést azonban egy kicsit más oldalról közelítve meg), amikor ezt írta: „Hogy az ember legalább egyetlen szót képes legyen megérteni, ne pusztán spirituális impulzusként (azaz reflexszerűen.) V. Z.), és mint egy fogalmat jelölő artikulált hang, az egész nyelvnek már teljesen és minden összefüggésében be kell ágyazódnia A nyelvben nincs semmi egyedi, minden egyes elem csak a részeként jelenik meg egész." W. Humboldt ezen ítéletét a modern tudomány nyelvére lefordítva a következő, M. Taube-éhoz tartozó megfogalmazást kapjuk: „... nem nehéz megérteni azt a nyelvet, mint szóbeli vagy írásbeli jelentéssel bíró szimbólumok rendszerét, nem formális rendszer, és nem redukálható rá anélkül, hogy ne rombolná le igaz természet... Ha egy nyelvet formalizálnak, az megszűnik nyelv lenni, és kóddá válik" ** .

* (W. Humboldt: A nyelvek összehasonlító tanulmányozása fejlődésük különböző korszakaihoz viszonyítva. Idézet a könyvből: V. A. Zvegintsev, A 19-20. századi nyelvészet története esszékben és kivonatokban, I. rész, M., 1964, 79. o.)

** (M. Taube, Számítógépek és józan ész, M.* 1964, 18. o.)

Ám ha a felsorolt ​​nyelvi nehézségekkel meg lehet birkózni, akkor is vannak szigorúan logikus sorrendű akadályok – ebben az esetben az úgynevezett „döntési szabályokról” beszélünk. Hiszen ha biztosak akarunk lenni abban, hogy a gép logikusan kifogástalanul fog működni, akkor egy olyan szabályrendszert kell megadnunk számára, amelyek betartásával a kezdeti információktól következetesen eljuthat a szükséges következtetésekig. A logikai propozicionális kalkulussal kapcsolatban vannak ilyen szabályok, de bonyolultabb logikákra nincsenek ilyen szabályok, sőt okkal feltételezhető, hogy ilyen szabályok nem találhatók. Ha azokra a szabályokra koncentrálunk, amelyek már rendelkezésünkre állnak, akkor ezek használatával olyan bonyolult lesz a feloldás folyamata (még fejlett számítógépek használata esetén is), hogy a játék nem éri meg a gyertyát *.

* (Hogy megmutassa, milyen munkát kell elvégeznie az egymást követő lépések módszerével működő számítógépnek, A. L. Samuel a dámajáték példájára tér ki. Ezt írja: „Ahhoz, hogy egy számítógép dámajátékra tudjon működni, először úgy kell ábrázolnunk a kockák helyzetét a táblán, hogy a számítógép emlékezzen, majd a jövőbe tekintve elemezni kell az egyes lépések következményeit , ahogy egy ember tenné, sorra figyelembe véve minden kezdeti lépést, majd az ellenfél összes lehetséges válaszlépését, majd mindegyikre az összes ellenreakciót stb. a lehető leggyorsabb gépre, amelyre csak olyan korlátok vonatkoznak, mint az univerzum mérete, az anyag molekuláris természete és a véges fénysebesség, akkor egy ilyen számítástechnikai gép sok évszázadot igényelne, és talán még a világegyetem koránál is tovább tartana. megtenni az első lépést" (A. L. Samuel, Artificial Intelligence: Progress and problems. Függelék a könyvhöz: M. Taube, Számítógépek és a józan ész, M., 1964* 140-141. o.).)

Így jelenik meg az alkalmazott nyelvészetből származó adatok alapján a logikai és matematikai módszerek nyelvtudományi alkalmazásának problémája. Mik a következtetések? A következtetéseket fentebb már megfogalmaztuk - a logikai elemzés lehetővé teszi az induktív módszerek kombinálását a deduktív módszerekkel, de amikor a deduktív módszerek nyelvtudományi használatáról beszélünk, akkor nem szabad mindent a nyelvészeti kutatásnak a logikai-matematikainak való vak alárendeltségére redukálni. mód. A természetes nyelv lázad az ilyen erőszak ellen. Az alkalmazott nyelvészet gyakorlata pedig megerősíti ezeket a következtetéseket, megállapítva, hogy olyan különbségek vannak a formalizált logikai nyelv és a természetes nyelv között, hogy a második eléggé teljes (információs szempontból) lefordítása az elsőre lehetetlen. Ez azt jelenti, hogy a nyelvészetben (és különösen az alkalmazott nyelvészetben) fel kell hagynunk a logikai-matematikai módszerek alkalmazásával? Természetesen nem. De nem szabad túlbecsülni a képességeiket. Eddig meglehetősen szerények. És hogy itt ne legyünk alaptalanok, térjünk át a matematikusok és a logikusok tanúságtételére, akiknek munkájuk gyakorlása során tudásukat a természetes nyelv tanulmányozására kell alkalmazniuk.

Ezt mondja a matematikus: „A matematika segítsége a természetes nyelv tanulmányozásában még korántsem nyilvánvaló... Mielőtt elgondolkodnánk a matematika számítási felhasználásán, meg kell határozni a nyelvi egységek határait és funkcióit. Ez nem matematikai probléma, a nyelvészet induktív módszereinek része.

Kiderült, hogy a matematika nem helyettesíti az empirikus módszertant, bár néhány nyelvész erre törekszik. Ellenkezőleg, csak a természetes nyelv egységeinek és relációinak induktív és megfelelő igazolása után teremtődnek meg a szükséges feltételek a matematika természetes nyelvre való reális alkalmazásához. Ebben az esetben a matematikusok vagy felfedezik, hogy valami új megnyilvánulásával van dolguk, ami lényegében már ismerős számukra, vagy pedig ösztönzést kapnak egy új rendű matematikai gondolkodásra."

* (P. Garvin és W. Karush, Linguistics - Data Processing and Mathematics, "Natural Language and the Computer", New York, 1963, pp. 368-369. Lásd még ugyanabban a könyvben a cikket: W. Ksrush, The Use of Mathematics in the Behavioral Sciences, pp. 64-83.)

És ezt mondja a logika: „A beszédinformációk automatikus feldolgozásának kilátásai nagyon jók, de a logika szerepe ezen a területen korlátozott, mint a nyelvi elemzés eszköze, nem pedig a következtetések levonásának szabályrendszere , valódi ígéreteket tesz” *. És folytatja annak megállapítását, hogy melyik kutatási stratégia előnyösebb: „A problémákat nem egy logika által felállított szabályrendszer rugalmatlan betartásával kell megoldani, hanem inkább heurisztikus technikák alkalmazásával ** ... Az automatika empirikus induktív megközelítése a beszédinformáció feldolgozását kell előnyben részesíteni, amelyben az információs problémák megoldására durva szabályokat kell keresni. A természetes nyelv elsajátítására fel kell hagyni a közelítő módszereket, amelyek a tapasztalatok felhalmozásával ugyanúgy finomodnak és javulnak, mint az elméletben, ahol a módosításokat és a fejlesztések a kísérlet eredményeként nyert adatok alapján történnek." ***

* (M. Maron, A Logician's View of Language – adatfeldolgozás, idézett könyv, 144. o.)

** (A. L. Samuel meglehetősen világos képet ad a heurisztikus módszertanról. A logikai eljárás formális technikájával szembeállítva azt írja, hogy helyette olyan technika alkalmazható, „ahol több, többé-kevésbé önkényesen választott eljárást meglehetősen hiányosan vizsgálnak meg, és mindegyik ad némi támpontot arra vonatkozóan, hogy a helyes út * egészen addig, amíg végül a találgatások nem vezetnek el a kielégítő bizonyításhoz. Mindkét esetben elképesztően rövid időn belül eljuthatunk a helyes vagy legalábbis nagyon jó válaszhoz. ugyanakkor nincs bizalom abban, hogy valaha is kapunk megoldást, valamint az a bizalom, hogy a számunkra bemutatott megoldás a legjobb "algoritmus"... A heurisztikus problémamegoldást, ha sikeres, természetesen magasabb rendű mentális tevékenységnek kell tekinteni, mint a problémák többé-kevésbé automatikus eljárással történő megoldását." Orosz fordításból idézve: A. L. Samuel, Artificial intelligence: progress and problems. Függelék a könyvhöz: M. Taube, Számítógépek és józan ész, M., 1964, 136-137.)

*** (M. Maron, op. cit., 143–144.)

Ezek az általános következtetések. Azt mondják, hogy a nyelvészek vezető szerepet játszanak a logikusokkal és matematikusokkal folytatott közös munkában. A nyelvészek feladata, hogy a nyelvi anyagot oly módon készítsék el, hogy az logikai-matematikai módszerekkel feldolgozható legyen. Ebben az irányban kell keresni a nyelvészetben az induktív módszerek és a deduktív módszerek reális kombinációját. És amikor az alkalmazott nyelvészeti problémák megoldása során heurisztikus hipotézisekről beszélünk, akkor ezeknek mindenekelőtt nyelvésztől kell származniuk, hiszen ő áll közelebb a nyelvhez, és pozíciójából adódóan köteles jobban megismerni és megérteni. .

            Amióta Baudouin de Courtenay 1904-ben először fejtette ki véleményét a matematikai módszerek használatának szükségességéről a nyelvészetben ( Kondrashov N.A., 1979, 170), elég sok idő telt el, mire megkezdődtek az első komolyabb kísérletek a használatukra. De fokozatosan a matematikai módszerek a nyelvészetben sokféle alkalmazásra találtak. Még a nyelvészet egész ága is kialakult - matematikai nyelvészet (Lesokhin M.M., 1982 és mások). A fonetikában és a szintaxisban a valószínűségszámításban ismert Markov-folyamatok alkalmazása nagy ígéretekkel kecsegtet. A minket leginkább érdeklő történeti és összehasonlító nyelvészetben a glottokronológia módszereit fejlesztik ki, amelyek közül az egyiket Maurice Swadesh javasolta (Maurice Swadesh, 1960-1). Feltételezte, hogy minden nyelv alapszókincsének egy bizonyos része egy bizonyos lexikai magot alkot, ami viszonylag stabil, mert állandó, de nagyon lassú ütemben változik, hozzávetőlegesen menet közben. radioaktív bomlás. Ha ismerjük azoknak a szavaknak a százalékát, amelyeket egy bizonyos ideig megőriztek egy nyelvben, akkor kiszámíthatjuk a lexikális összetétel változásának sebességi állandóját, amely bár állandó érték, de a különböző nyelveken és különböző nyelveken kissé eltérhet. fejlődésük időszakai. Listát állított össze a szavak lexikai magjáról, először 100, majd 200 szóból, és összehasonlítva az ebben a magban lévő szavak százalékos arányát, amelyek egymáshoz közeli rokon nyelvpárokban maradtak fenn, megpróbálta kiszámítani az időt. ami eltelt azóta, hogy ezek a nyelvek elváltak egymástól. A nyelvváltás üteme azonban valójában nagyon eltérő nyelven és korszakonként. Vl Georgiev szerint „a primitív rendszerben a társadalmi élet és a nyelv változásainak folyamata annál lassabban megy végbe, minél mélyebbre hatolunk az évezredek mélyére: a legkisebb változásokhoz nem évszázadokra, hanem évezredekre volt szükség. Georgiev Vl., 1958, 243). Ezért valószínű, hogy a Swadesh által kapott számítási eredmények ellentmondtak a nyilvánvaló tényeknek, és a tudós megpróbálta javítani a módszerét, de hiába ( Swadesh Morris, 1960-2). Ötlete minden bizonnyal nagyon érdekes volt, de megvalósítása lehetetlen volt a lexikális mag változásainak sebességi állandójának meghatározásának nehézségei miatt, valamint az alapvető lehetetlenség miatt, hogy ehhez a maghoz olyan szólistát állítsanak össze, amely minden nyelvre univerzális lenne. a világ kivétel nélkül. A problémák megoldásának lehetetlenségét Harry Heuer ( Hoyer Harry, 1960) és V. A. Zvegintsev, aki ezt írta:


            Amikor M. Swadesh megpróbál összeállítani egy „kísérleti listát”, amely minden nyelvre alkalmas, és univerzális szabályokat fogalmaz meg annak összeállítására, olyan feladatot tűz ki maga elé, amely valójában nem teljesíthető" (Zvegintsev V.A., 1960, 13) .


          Az egyes nyelvek korának meghatározására is érdekes kísérletet tett M.V. Arapov és M.M. Azt a feladatot tűzték ki maguk elé, hogy „a szótár változásainak matematikai modelljét építsék fel, és e modell alapján elméletileg meghatározzák a szó előfordulási ideje és a gyakorisági szótárban elfoglalt rangja közötti összefüggést” ( Arapov M.V., Herts M.M., 1974, 3). Ennek a modellnek a birtokában az egyes, rokon nyelvek életkorának kiszámítását remélték. Ehhez egy empirikus képletet javasoltak, amely leírja egy szó egy kiválasztott időpontban való megjelenésének valószínűségét. Ebben a képletben a kulcsfontosságú helyet egy bizonyos állandó foglalja el, amely maga is változhat a különböző kronológiai szakaszok és a különböző nyelvek esetében, de a nyelv fejlődési üteme a különböző időszakokban, mint már említettük, nagyon eltérő lehet, és most már nem tudjuk. rendelkezik a legcsekélyebb információval ezekről a jellemzők ábrázolásáról. A szerzők objektíven értékelték módszerüket, megjegyezve, hogy csak bemutatni akarták annak képességeit, mert az állandó kiszámításához egységes módszertan szerint összeállított gyakorisági szótárak szükségesek, illetve a történeti lexikográfiát olyan mértékben kell fejleszteni, hogy az lehetővé tenné egy új szó megjelenésének pillanatának legalább egy évszázadig tartó pontos rögzítését. "Mivel mindkét követelmény nem teljesül, az egyes nyelvek változási sebességére vonatkozó adatok nem összehasonlíthatók" ( Arapov M.V., Herts M.M., 1974, 56). Ezért a módszer még megvalósítására vár.

            Az első kísérletet a nyelvek közötti kapcsolat mértékének számszerűsítésére J. Chekanovsky tette még 1927-ben. A függetlenség matematikai kritériumával próbálta felmérni két olyan asszociáció hasonlóságát, amelyet E. B. Taylor vezetett be az antropológiai kutatások gyakorlatába 1888-ban. Ezzel a módszerrel a lengyel kutató a szláv nyelvek rokonsági fokát tükrözte, majd később néhányé. indoeurópai nyelvek ( Czekanowski jan, 1957, 71). A módszert a legtöbb nyelvész nem fogadta el a jellemzők önkényes megválasztása és néhányuk kétszeres számbavétele miatt ( Popowska-Taborska Hanna, 1991, 34). Az asszociációk hasonlóságának felmérésére más módszerek is léteznek, amelyek figyelembe veszik a jelenlétet egy bizonyos jel két objektum egyikében, amely hiányzik a másik objektumból.

            A nyelvek kapcsolatának szókincs-összehasonlítással történő vizsgálatához azonban elfogadhatatlanok, mert a tulajdonság hiánya a valóságban csak a hiányát jelentheti a rendelkezésünkre, de valójában létezhetett vagy létezik. most, de tudományos kutatók nem rögzítették. A régészetben és az antropológiában hasonló módszerek alkalmazhatók, mert ott olyan tárgyi tárgyakkal van dolgunk, amelyek kellően képet alkotnak eredeti formájukról, de a nyelvtörténetben soha nem lehetünk biztosak abban, hogy a tárgyban nincsenek jellemzők. kutatás a távoli múltban. Ezért a nyelvészetben van egy szabály: „Csak a pozitív tényeknek van bizonyító ereje”.

            Később Czekanovsky gondolatait bizonyos értelemben egy másik lengyel kutató, V. Manchak is folytatta, aki ragaszkodik ahhoz az alapkoncepcióhoz: van bizonyos kapcsolat a nyelvek rokonsága és földrajzi elhelyezkedése között ( Mańczak Witold, 1981, 138). Összehasonlítja a gót, az óbolgár és a litván nyelv gyakori szavainak számát, kizárólag az ezeken a nyelveken írt bibliai szövegeket felhasználva, feltételezve, hogy azok nagyon közel állnak a germán, szláv és balti nyelvekhez. Második alapelv: a nyelvtanokban és szótárakban fellelhető dolgok megszámlálása gyakran hamis következtetésekhez vezethet, míg a szövegekben foglaltak számbavétele lehetővé teszi az igazság felfedezését. Nem itt érdemes figyelembe venni a nyelvi elveit, főleg, hogy Popowska-Taborska ezt már megtette ( Popowska-Taborska Hanna, 1991, 35-35, 94-97), de a kutatás matematikai oldala bizonyos megjegyzéseket igényel. A három nyelvből nyert adatok alapján általában lehetetlen a szlávok ősi hazájának földrajzi elhelyezkedését összekötni, mert képletesen szólva egy egyenletben több ismeretlen található. Miután megkaptuk a három nyelv egy síkon való elhelyezkedésének valós diagramját, pontosan ismernünk kell legalább az egyik nyelv kialakulásának helyét, és meg kell bizonyosodnunk arról, hogy a többi nyelv egyikének területe egy bizonyos irányban fekszik tőle. Ezenkívül az időt is meg kell valahogy határozni, mert az idő múlásával mindhárom nyelv beszélői többször is megváltoztathatják településük helyét, és egymáshoz képest különböző pozíciókban találhatják magukat. Ezen nyelvek latinnal való kapcsolatának tanulmányozása, ahogyan Manchak is, szintén keveset változtat, mert nincs okunk eleve feltételezni, hogy a germán, szláv és balti nyelvek a rómaiak fennállása alatt alakultak ki. Birodalom.

Mennyibe kerül a dolgozat megírása?

Munkatípus kiválasztása Diplomamunka (baccalaureus/specialista) A szakdolgozat része Mesterdiploma Tanfolyam gyakorlattal Árfolyamelmélet Absztrakt Esszé Tesztmunka Célok Tanúsító munka (VAR/VKR) Üzleti terv Vizsgakérdések MBA diplomamunka (főiskola/műszaki iskola) Egyéb esetek Laboratóriumi munka, RGR Online súgó Gyakorlati jelentés Információ keresése PowerPoint prezentáció Absztrakt érettségihez Kísérő anyagok a diplomához Cikk tesztrajzok tovább »

Köszönjük, e-mailt küldtünk Önnek. Nézd meg az e-mailedet.

Szeretnél egy promóciós kódot 15% kedvezménnyel?

SMS fogadása
promóciós kóddal

Sikeresen!

?Adja meg a promóciós kódot a menedzserrel folytatott beszélgetés során.
A promóciós kód egyszer használható fel az első rendelésnél.
A promóciós kód típusa - " diplomás munka".

A matematika és a nyelvészet kölcsönhatása


Bevezetés

1. fejezet A matematikai módszerek nyelvtudományi alkalmazásának története

1.1. A szerkezeti nyelvészet kialakulása a 19-20. század fordulóján

1.2. Matematikai módszerek alkalmazása a nyelvészetben a huszadik század második felében

2. fejezet Válogatott példák a matematika nyelvtudományi felhasználására

2.1. Gépi fordítás

2.2.Statisztikai módszerek a nyelvtanulásban

2.3. Nyelvtanulás formális logikai módszerekkel

2.4. A matematikai módszerek nyelvtudományi alkalmazásának távlatai

Következtetés

Irodalom

1. melléklet Ronald Schleifer. Ferdinand de Saussure

2. függelék Ferdinand de Saussure (fordítás)

Bevezetés


A huszadik században folytatódott a különböző tudásterületek interakciója és áthatolása felé irányuló tendencia. Az egyes tudományok közötti határok fokozatosan elmosódnak; A szellemi tevékenységnek egyre több olyan ága van, amely a humanitárius, műszaki és természettudományi ismeretek „metszéspontjában” áll.

A modernitás másik nyilvánvaló vonása a struktúrák és alkotóelemeik tanulmányozásának vágya. Ezért mind a tudományelméletben, mind a gyakorlatban egyre nagyobb teret kap a matematika. Egyrészt a logikával és a filozófiával, másrészt a statisztikával (és ennek következtében a társadalomtudományokkal) érintkezve a matematika egyre mélyebbre hatol azokra a területekre, amelyeket sokáig tisztán „humanitáriusnak tartottak, ” heurisztikus potenciáljuk bővítése (a „mennyit” kérdésre adott válasz gyakran segít a „mit” és a „hogyan” kérdések megválaszolásában. A nyelvészet sem volt kivétel.

Tantárgyi munkám célja, hogy röviden rávilágítsak a matematika és a nyelvtudomány egy olyan ága, mint a nyelvészet kapcsolatára. A múlt század 50-es évei óta a matematikát a nyelvészetben használták a nyelvek (természetes és mesterséges) szerkezetének leírására szolgáló elméleti apparátus létrehozására. Meg kell azonban mondani, hogy nem talált azonnal ilyen gyakorlati alkalmazást. Kezdetben a nyelvészetben a matematikai módszereket kezdték alkalmazni a nyelvtudományi alapfogalmak tisztázására, de a számítástechnika fejlődésével egy ilyen elméleti előfeltevés a gyakorlatban is elkezdődött. Az olyan problémák megoldása, mint a gépi fordítás, a gépi információkeresés és az automatikus szövegfeldolgozás, alapvetően új nyelvi megközelítést igényelt. Felmerült a kérdés a nyelvészekben: hogyan lehet megtanulni a nyelvi mintákat olyan formában ábrázolni, hogy azok közvetlenül alkalmazhatók legyenek a technológiában. A korunkban elterjedt „matematikai nyelvészet” kifejezés minden olyan nyelvészeti kutatásra vonatkozik, amely egzakt módszereket alkalmaz (és a tudományban az egzakt módszerek fogalma mindig szorosan összefügg a matematikával). Az elmúlt évek tudósai egy része úgy véli, hogy magát a kifejezést nem lehet egy kifejezés rangjára emelni, hiszen nem jelöl semmiféle speciális „nyelvészetet”, csak egy új irányt, amely a nyelvkutatási módszerek javítására, pontosságának és megbízhatóságának növelésére irányul. A nyelvészet kvantitatív (algebrai) és nem kvantitatív módszereket egyaránt alkalmaz, ami közelebb viszi a matematikai logikához, következésképpen a filozófiához, sőt a pszichológiához is. Schlegel is felhívta a figyelmet a nyelv és a tudat kölcsönhatására, és a huszadik század elejének kiemelkedő nyelvésze, Ferdinand de Saussure (a nyelvtudományi matematikai módszerek fejlődésére gyakorolt ​​hatásáról a későbbiekben szólok) a nyelv szerkezetét összekapcsolta egy nyelvhez való tartozásával. emberek. L. Perlovsky modern kutató tovább megy, egy nyelv kvantitatív jellemzőit (például nemek számát, esetek számát) a nemzeti mentalitás jellemzőivel azonosítja (erről bővebben a 2.2. „Nyelvtudományi statisztikai módszerek” című részben).

A matematika és a nyelvészet kölcsönhatása sokrétű téma, munkámban nem mindegyikre, hanem mindenekelőtt annak alkalmazott vonatkozásaira térek ki.

I. fejezet A matematikai módszerek nyelvtudományi alkalmazásának története


1.1 A szerkezeti nyelvészet kialakulása a 19-20. század fordulóján


A nyelv matematikai leírása a nyelv mint mechanizmus elgondolásán alapul, amely a huszadik század elejének híres svájci nyelvészéhez, Ferdinand de Saussure-hoz nyúlik vissza.

Koncepciójának kiinduló láncszeme a nyelv elmélete, mint három részből álló rendszer (maga nyelv - nyelv, beszéd - parole és beszédtevékenység - langage), amelyben minden szót (a rendszer tagját) nem önmagában tekinti. , hanem más tagokkal kapcsolatban. Amint egy másik kiemelkedő nyelvész, a dán Louis Hjelmslev később megjegyezte, Saussure „elsőként követelte meg a nyelv strukturális megközelítését, vagyis a nyelv tudományos leírását az egységek közötti kapcsolatok rögzítésével”.

A nyelvet hierarchikus struktúraként értelmezve Saussure volt az első, aki felvetette a nyelvi egységek értékének és jelentőségének problémáját. Az egyes jelenségeket, eseményeket (mondjuk az egyes indoeurópai szavak keletkezésének történetét) nem önmagukban kell tanulmányozni, hanem olyan rendszerben, amelyben hasonló összetevőkkel korrelálnak.

Saussure a nyelv szerkezeti egységének a szót, a „jelet” tekintette, amelyben a hang és a jelentés egyesült. Ezek az elemek egyike sem létezik egymás nélkül: ezért az anyanyelvi beszélő egy poliszemantikus szó különböző jelentésárnyalatait a szerkezeti egészben, a nyelvben különálló elemként érti.

F. de Saussure elméletében tehát látható a nyelvészet kölcsönhatása egyrészt a szociológiával és a szociálpszichológiával (megjegyzendő, hogy egy időben alakult ki Husserl fenomenológiája, Freud pszichoanalízise, ​​Einstein relativitáselmélete irodalomban, zenében és képzőművészetben formai és tartalmi kísérletek folynak, másrészt matematikával (a rendszeresség fogalma a nyelv algebrai fogalmának felel meg). Ez a fogalom megváltoztatta a nyelvi értelmezés fogalmát mint olyat: a jelenségeket nem előfordulásuk okaihoz viszonyítva kezdték értelmezni, hanem a jelenhez és a jövőhöz viszonyítva. Az értelmezés már nem független az ember szándékaitól (annak ellenére, hogy a szándékok lehetnek személytelenek, a szó freudi értelmében „tudattalanok”).

A nyelvi mechanizmus működése az anyanyelvi beszélők beszédtevékenységén keresztül nyilvánul meg. A beszéd eredménye az úgynevezett „helyes szövegek” - beszédegységek sorozatai, amelyek engedelmeskednek bizonyos mintáknak, amelyek közül sok lehetővé teszi a matematikai leírást. A szintaktikai struktúra leírására szolgáló módszerek elmélete a helyes szövegek (elsősorban mondatok) matematikai leírásának módszereivel foglalkozik. Egy ilyen struktúrában a nyelvi analógiákat nem az eredendő tulajdonságaik, hanem a rendszerszerű („strukturális”) kapcsolatok segítségével határozzák meg.

Nyugaton Saussure gondolatait a nagy svájci nyelvész fiatalabb kortársai dolgozzák ki: Dániában – a már említett L. Hjelmslev –, aki „A nyelvelmélet alapjai” című munkájában az algebrai nyelvelméletet szülte, az USA-ban – E. Sapir, L. Bloomfield, C. Harris, Csehországban - N. Trubetskoy orosz emigráns tudós.

A nyelvtanulás statisztikai mintáit nem más kezdte el tanulmányozni, mint a genetika megalapítója, Georg Mendel. A filológusok csak 1968-ban fedezték fel, hogy élete utolsó éveiben szívesen tanulmányozta a nyelvi jelenségeket matematikai módszerekkel. Mendel ezt a módszert a biológiából hozta a nyelvészetbe; a 19. század kilencvenes éveiben csak a legmerészebb nyelvészek és biológusok nyilatkoztak egy ilyen elemzés megvalósíthatóságáról. A Szt. kolostor archívumában. Tomas Brünnben, ahol Mendel apát volt, lapokat találtak „mann”, „bauer”, „mayer” végződésű vezetéknevek oszlopaival, valamint néhány törtszámmal és számítással. Mendel a családnevek eredetének formai törvényszerűségeinek feltárása érdekében összetett számításokat végez, amelyek során figyelembe veszi a német nyelv magán- és mássalhangzóinak számát, az általa figyelembe vett szavak teljes számát, a vezetéknevek számát, stb.

Nálunk a szerkezeti nyelvészet nagyjából a nyugatival egy időben - a 19-20. század fordulóján - kezdett kifejlődni. F. de Saussure-ral egyidőben a nyelv mint rendszer fogalmát a kazanyi egyetem professzora, F.F. Fortunatov és I.A. Baudouin de Courtenay. Utóbbi ennek megfelelően hosszú ideig levelezett de Saussure-ral, a genfi ​​és a kazanyi nyelvészeti iskola együttműködött egymással. Ha Saussure-t a nyelvészet „egzakt” módszereinek ideológusának nevezhetjük, akkor ezek alkalmazásának gyakorlati alapjait Baudouin de Courtenay fektette le. Ő volt az első, aki elválasztotta a nyelvészetet (mint statisztikai módszereket és funkcionális függőséget alkalmazó egzakt tudományt) a filológiától (a szellemi kultúrát nyelven és beszéden keresztül vizsgáló humanitárius tudományágak közössége). Maga a tudós úgy vélte, hogy „a nyelvészet csak akkor lehet hasznos a közeljövőben, ha megszabadul a filológiával és az irodalomtörténettel való kötelező egyesüléstől”. A fonológia lett a matematikai módszerek nyelvtudományi bevezetésének „próbaterepe” - a hangok, mint a nyelvi rendszer „atomjai”, korlátozott számú, könnyen mérhető tulajdonsággal rendelkeztek, a formális, szigorú leírási módszerek legkényelmesebb anyaga. A fonológia tagadja a hang jelentésének jelenlétét, így a kutatás során az „emberi” tényezőt kiiktatták. Ebben az értelemben a fonémák olyanok, mint a fizikai vagy biológiai tárgyak.

A fonémák, mint az észlelés számára elfogadható legkisebb nyelvi elemek, külön szférát, külön „fenomenológiai valóságot” képviselnek. Például az angolban a "t" hangot többféleképpen lehet kiejteni, de az angolul beszélő személy minden esetben "t"-ként fogja fel. A lényeg, hogy a fonéma betöltse fő – jelentésmegkülönböztető – funkcióját. Ezen túlmenően a nyelvek közötti különbségek olyanok, hogy az egyik hang változatai egy nyelven különböző fonémáknak felelhetnek meg egy másikban; például az „l” és az „r” különbözik az angolban, míg más nyelveken ugyanannak a fonémának a változatai (mint például az angol „t”, aspirated vagy unaspirated kiejtése). Bármely természetes nyelv hatalmas szókincse sokkal kisebb számú fonéma kombinációinak gyűjteménye. Az angolban például csak 40 fonémát használnak körülbelül egymillió szó kiejtésére és írására.

A nyelv hangjai a jellemzők szisztematikusan szervezett halmazát képviselik. Az 1920-as és 1930-as években, Saussure nyomán, Jacobson és N.S. Trubetskoy azonosította a fonémák „megkülönböztető vonásait”. Ezek a tulajdonságok a beszédszervek - nyelv, fogak, hangszálak - szerkezetén alapulnak. Mondjuk, angolul a „t” és a „d” közötti különbség a „hang” jelenléte vagy hiánya (a hangszálak feszültsége) és a hangszint, amely megkülönbözteti az egyik fonémát a másiktól. Így a fonológia egy Saussure által leírt általános nyelvi szabály példájának tekinthető: „A nyelvben csak különbségek vannak”. Még csak nem is ez a fontos: a különbség általában magában foglalja azokat a pontos feltételeket, amelyek között van; de a nyelvben csak különbségek vannak pontos feltételek nélkül. Akár „jelölőnek”, akár „jelzettnek” tekintjük, a nyelvben nincsenek olyan fogalmak vagy hangok, amelyek a nyelvrendszer kialakulása előtt léteztek.

Így a Saussure-i nyelvészetben a vizsgált jelenséget a nyelv összehasonlításának és ellentéteinek összességeként értelmezik. A nyelv a szavak jelentésének kifejezője és kommunikációs eszköze is, és ez a két funkció soha nem esik egybe. Észrevehető a forma és a tartalom váltakozása: a nyelvi ellentétek határozzák meg szerkezeti egységeit, és ezek az egységek kölcsönhatásban hoznak létre egy bizonyos értelmes tartalmat. Mivel a nyelv elemei véletlenszerűek, sem kontraszt, sem kombináció nem lehet az alap. Ez azt jelenti, hogy egy nyelvben a megkülönböztető jegyek fonetikai kontrasztot alkotnak a megértés különböző szintjén, a fonémák morfémákká, a morfémák szavakká, a szavak mondatokká stb. Mindenesetre egy egész fonéma, szó, mondat stb. több, mint részeinek összege.

Saussure egy új, a nyelvészettől elkülönülő, huszadik századi tudomány ötletét javasolta, amely a jelek társadalomban betöltött szerepét vizsgálja. Saussure ezt a tudományt szemiológiának nevezte (a görög „semeоon” - jelből). Az 1920–1930-as években Kelet-Európában, az 1950–60-as években Párizsban kifejlődött szemiotika „tudománya” a nyelv és a nyelvi struktúrák vizsgálatát kiterjesztette az e struktúrák felhasználásával megkomponált (vagy megfogalmazott) irodalmi megállapításokra. Emellett Saussure pályafutása alkonyán, általános nyelvészeti kurzusával párhuzamosan elkezdte a késő római költészet „szemiotikai” elemzését, megpróbálva felfedezni a tulajdonnevek szándékosan megkomponált anagrammáit. Ez a módszer nyelvi elemzésében sok tekintetben a racionalizmus ellentéte volt: kísérlet volt a nyelvi „valószínűség” problémájának egy rendszerben történő tanulmányozására. Az ilyen kutatások segítenek a valószínűség „anyagi oldalára” összpontosítani; „A kulcsszó”, amelynek anagrammáját Saussure keresi, ahogy Jean Starobinsky állítja, „a költő eszközét, és nem a vers életének forrását”. A vers a kulcsszó hangjainak megfordítására szolgál. Starobinsky szerint ebben az elemzésben "Saussure nem mélyed el a rejtett jelentések keresésében". Éppen ellenkezőleg, műveiben észrevehető a tudattal kapcsolatos kérdések elkerülésének vágya: „mivel a költészet nemcsak szavakban fejeződik ki, hanem abban is, amit ezek a szavak generálnak, túlmutat a tudat irányításán, és csak a törvényektől függ. nyelvről” (lásd . 1. melléklet).

Saussure azon kísérlete, hogy a késő római költészet tulajdonneveit tanulmányozza, kiemeli nyelvi elemzésének egyik összetevőjét – a jelek önkényes voltát, valamint Saussure nyelvészetének formai lényegét, amely kizárja a jelentéselemzés lehetőségét. Todorov arra a következtetésre jut, hogy Saussure munkái manapság szokatlanul következetesnek tűnnek abban, hogy vonakodnak egy jelenség világosan meghatározott jelentésű szimbólumait tanulmányozni [1. melléklet]. Az anagrammák tanulmányozása során Saussure csak az ismétlésre figyel, a korábbi változatokra nem. . . . A Nibelungok tanulmányozása során a szimbólumokat csak azért azonosítja, hogy hibás olvasatokhoz rendelje őket: ha nem szándékosak, akkor nem léteznek szimbólumok. Hiszen általános nyelvészeti írásaiban egy olyan szemiológia létezését sugallja, amely nemcsak nyelvi jeleket ír le; de ennek a feltételezésnek az a tény korlátozza, hogy a szemiológia csak véletlenszerű, önkényes jeleket tud leírni.

Ha ez valóban így van, csak azért, mert nem tudta elképzelni a „szándékot” tárgy nélkül; nem tudta teljesen leküzdeni a forma és a tartalom közötti szakadékot - műveiben ez kérdéssé vált. Ehelyett a „nyelvi törvényességre” hivatkozott. Egyrészt a tizenkilencedik századi történelemre és szubjektív sejtésre épülő fogalmak, másrészt az ezekre épülő esetleges értelmezési módszerek, másrészt a forma és a tartalom ellentétét eltörlő strukturalista fogalmak (szubjektív, ill. tárgy), jelentés és eredet a strukturalizmusban, a pszichoanalízisben, sőt a kvantummechanikában is, Ferdinand de Saussure nyelvészetről és szemiotikáról szóló írásai fordulópontot jelentenek a nyelv és kultúra jelentésének vizsgálatában.

Az 1928-as hágai első nemzetközi nyelvészkongresszuson orosz tudósok is képviseltették magukat. S. Kartsevsky, R. Jacobson és N. Trubetskoy a nyelv hierarchikus szerkezetét vizsgálta – a múlt század eleji legmodernebb eszmék jegyében. Jacobson munkáiban kidolgozta Saussure gondolatait, miszerint a nyelv alapelemeit mindenekelőtt funkciójukkal, nem pedig előfordulásuk okaival összefüggésben kell tanulmányozni.

Sajnos Sztálin 1924-es hatalomra kerülése után a hazai nyelvészet – sok más tudományhoz hasonlóan – visszaszorult. Sok tehetséges tudós emigrációba kényszerült, kiutasították az országból, vagy táborokban haltak meg. Csak az 1950-es évek közepétől vált lehetségessé az elméletek pluralizmusa – erről bővebben az 1.2. részben.


1.2 A matematikai módszerek alkalmazása a nyelvészetben a huszadik század második felében


A huszadik század közepére négy világnyelvi iskola alakult ki, amelyek mindegyike egy-egy „egzakt” módszer ősének bizonyult. A leningrádi fonológiai iskola (alapítója Baudouin de Courtenay tanítványa, L. V. Shcherba) az anyanyelvi beszélők beszédének elemzésén alapuló pszicholingvisztikai kísérletet használt a hang fonéma formájú általánosításának fő kritériumaként.

A Prágai Nyelvészeti Kör tudósai, különösen alapítója, N.S. Az Oroszországból emigrált Trubetskoy kidolgozta az oppozíciók elméletét - a nyelv szemantikai szerkezetét ők oppozíciósan felépített szemantikai egységek - családok - halmazaként írták le. Ezt az elméletet nemcsak a nyelv, hanem a művészi kultúra tanulmányozásában is használták.

Az amerikai deskriptivizmus ideológusai L. Bloomfield és E. Sapir nyelvészek voltak. A nyelvet beszédmegnyilatkozások összességeként mutatták be a deskriptivistáknak, amelyek kutatásaik fő tárgyát képezték. Fókuszban a szövegek tudományos leírásának (innen a név) szabályai álltak: elemeik szervezésének, elrendezésének, osztályozásának vizsgálata. Az analitikai eljárások formalizálása a fonológia és morfológia területén (a nyelv különböző szintű tanulmányozásának elveinek kidolgozása, eloszlásanalízis, a közvetlen komponensek módszere stb.) a nyelvi modellezés általános kérdéseinek megfogalmazásához vezetett. A nyelv tartalmi terve iránti figyelmetlenség, valamint a nyelv paradigmatikus oldala nem tette lehetővé a deskriptivisták számára, hogy a nyelvet rendszerként teljes mértékben értelmezzék.

Az 1960-as években kialakult a formális nyelvtan elmélete, amely főként N. Chomsky amerikai filozófus és nyelvész munkáinak köszönhető. Joggal tartják az egyik leghíresebb modern tudósnak és közéleti személyiségnek, számos cikket, monográfiát, sőt egész estés dokumentumfilmet is szentelnek neki. A Chomsky által kitalált, alapvetően új szintaktikai struktúra leírási mód - generatív (generatív) grammatika - után a megfelelő nyelvészeti irányzatot generativizmusnak nevezték.

Chomsky, az oroszországi bevándorlók leszármazottja, 1945-től nyelvészetet, matematikát és filozófiát tanult a Pennsylvaniai Egyetemen, tanára, Zelig Harris nagy hatással rá – Harrishoz hasonlóan Chomsky is az anarchizmushoz közelinek tartotta és tartja politikai nézeteit (még ismert). mint a létező amerikai politikai rendszer kritikusa és az antiglobalizmus egyik szellemi vezetője).

Első szak tudományos munka Chomsky „A modern héber morfológiája” (1951) című mesterdolgozata kiadatlan maradt. Chomsky 1955-ben doktorált a Pennsylvaniai Egyetemen, de a disszertációjának alapjául szolgáló kutatások nagy része (teljes egészében csak 1975-ben jelent meg „A nyelvelmélet logikai szerkezete” címmel) és első monográfiája, a „Syntactic” Structures” (Syntactic Structures, 1957, orosz. ford. 1962), a Harvard Egyetemen 1951–1955-ben adták elő. Ugyanebben 1955-ben a tudós a Massachusetts Institute of Technology-ba költözött, ahol 1962-ben professzor lett.

Kidolgozása során Chomsky elmélete több szakaszon ment keresztül.

Első monográfiájában, a „Syntactic Structures”-ben a tudós a nyelvet olyan mechanizmusként mutatta be, amely végtelen számú mondat generálására alkalmas nyelvtani eszközök véges halmazával. A nyelvi tulajdonságok leírására javasolta a mély (közvetlen észlelés elől elrejtett és rekurzív, azaz ismételten alkalmazható szabályok rendszere által generált) és felszíni (közvetlenül észlelhető) nyelvtani struktúrák fogalmait, valamint az átmenetet leíró transzformációkat. mély struktúrákból felszínre. Egy mélyszerkezet megfelelhet több felszíni szerkezetnek (például a passzív konstrukció Az elnök által aláírt rendelet ugyanabból a mélyszerkezetből származik, mint az aktív konstrukció Az elnök aláírja a rendeletet) és fordítva (például a kétértelműség Anya szereti a lányát két különböző mélységbe visszanyúló felszíni struktúrák egybeesésének eredményeként írják le, amelyek közül az egyikben az anya az, aki szereti a lányát, a másikban pedig az, akit a lánya szeret).

Chomsky standard elmélete az Aspektus-modell, amelyet Chomsky Aspects of the Theory of Syntax című könyvében fejt ki. Ebben a modellben kerültek be először a formális elméletbe a mélystruktúráknak értelmet adó szemantikai értelmezési szabályok. Az „Aspektusokban” a nyelvi kompetencia a nyelvhasználattal (teljesítmény) áll szemben, átveszi az úgynevezett Katz-Postal hipotézist a jelentés megőrzéséről az átalakulás során, ezért az opcionális transzformáció fogalma kizárt, és egy apparátus a lexikai kompatibilitást leíró szintaktikai jellemzők kerülnek bevezetésre.

Az 1970-es években Chomsky a kormányzás és a kötelező erejű elmélet elméletén dolgozott (GB-elmélet – a kormány és kötelező szavakból) – általánosabb, mint az előző. Ebben a tudós elhagyta az egyes nyelvek szintaktikai struktúráit leíró specifikus szabályokat. Minden transzformációt egyetlen univerzális mozgástranszformáció váltott fel. A GB elmélet keretein belül vannak privát modulok is, amelyek mindegyike felelős a saját nyelvtani részéért.

Chomsky még 1995-ben egy minimalista programot terjesztett elő, amelyben az emberi nyelvet a gépi nyelvhez hasonlónak írják le. Ez csak egy program – nem modell vagy elmélet. Ebben Chomsky az emberi nyelvi apparátus két fő alrendszerét azonosítja: a lexikont és a számítástechnikai rendszert, valamint két interfészt - fonetikus és logikai.

A Chomsky formális nyelvtanai klasszikussá váltak nemcsak a természetes, hanem a mesterséges nyelvek – különösen a programozási nyelvek – leírására is. A strukturális nyelvészet fejlődése a huszadik század második felében joggal tekinthető „chomsky-i forradalomnak”.

Moszkvai fonológiai iskola, amelynek képviselői A.A. Reformatsky, V.N. Sidorov, P.S. Kuznyecov, A.M. Sukhotin, R.I. Avanesov hasonló elméletet alkalmazott a fonetika tanulmányozására. Fokozatosan a „pontos” módszereket nemcsak a fonetikára, hanem a szintaxisra is alkalmazni kezdik. Mind a nyelvészek, mind a matematikusok itthon és külföldön egyaránt elkezdik tanulmányozni a nyelv szerkezetét. Az 1950-60-as években a matematika és a nyelvészet kölcsönhatásának új szakasza kezdődött a Szovjetunióban, a gépi fordítási rendszerek fejlődésével összefüggésben.

E munka megkezdéséhez hazánkban a gépi fordítás területén az Egyesült Államokban történt első fejlemények adták a lendületet (bár P. P. Smirnov-Troyansky első gépesített fordítóeszközét a Szovjetunióban találták fel 1933-ban, ez primitív volt, nem terjedt el széles körben). 1947-ben A. Butt és D. Britten kidolgozott egy kódot a számítógépes szavankénti fordításhoz, egy évvel később R. Richens egy szabályt javasolt a szavak tövekre és végződésekre való felosztására a gépi fordításban. Ezek az évek egészen mások voltak, mint a maiak. Ezek nagyon nagy és drága gépek voltak, amelyek egész helyiségeket foglaltak el, és nagyszámú mérnököt, kezelőt és programozót igényeltek a karbantartásukhoz. Ezekkel a számítógépekkel alapvetően a katonai intézmények igényeinek megfelelő matematikai számításokat végeztek – a matematika, a fizika és a technika újdonságai elsősorban a katonai ügyeket szolgálták. A korai szakaszban az MP fejlesztését a katonaság aktívan támogatta, míg (a hidegháború idején) az USA-ban orosz-angol, a Szovjetunióban pedig angol-orosz irányvonal alakult ki.

1954 januárjában a „Georgetown Experiment”-re a Massachusettsi Műszaki Egyetemen került sor – az orosz nyelvről angolra fordítás első nyilvános bemutatója egy IBM-701 gépen. A kísérlet sikeres befejezéséről szóló üzenet kivonata, amelyet D.Yu. Panov, megjelent a Russian Journal of Mathematics, 1954, 10. számban: „Fordítás egyik nyelvről a másikra gép segítségével: jelentés az első sikeres tesztről.”

D. Yu Panov (akkoriban a Tudományos Információs Intézet - INI, később VINITI igazgatója) bevonta I. K. Belskaya-t, hogy a gépi fordítással foglalkozzon, aki később a Precíziós Matematikai és Számítástechnikai Intézet gépi fordítási csoportját vezette. Szovjetunió Tudományos Akadémia. Az angolról oroszra történő fordítás első tapasztalata a BESM gép segítségével 1955 végére nyúlik vissza. A BESM programjait az N.P. Trifonov és L.N. Koroljov, akinek doktori disszertációját a gépi fordításhoz szükséges szótárak készítésének módszereivel foglalkozott.

Ezzel párhuzamosan a Szovjetunió Tudományos Akadémia Matematikai Intézetének (jelenleg az Orosz Tudományos Akadémia M. V. Keldysh Alkalmazott Matematikai Intézetének) Alkalmazott Matematikai Osztályán gépi fordítással kapcsolatos munkát végeztek. A matematikus A.A. kezdeményezésére. Ljapunova. A Steklov Matematikai Intézet végzős hallgatóját bevonta a szövegek fordításába a Strela géppel franciáról oroszra. Kulagin és tanítványai T.D. Ventzel és N.N. Ricco. Ljapunov és Kulagina ötleteit a technológia felhasználásának lehetőségéről az egyik nyelvről a másikra történő fordításhoz a Nature folyóiratban tették közzé, 1955, 8. szám. 1955 vége óta csatlakozott hozzájuk T.N. Moloshnaya, aki ezután önálló munkát kezdett egy angol-orosz fordítási algoritmuson.

R. Frumkina, aki akkoriban spanyol nyelvű algoritmikus fordítással foglalkozott, úgy emlékszik vissza, hogy a munka ezen szakaszában nehéz volt következetes lépéseket tenni. Sokkal gyakrabban kellett követnem a heurisztikus tapasztalatokat – a sajátom vagy a kollégáim.

A gépi fordítórendszerek első generációja azonban nagyon tökéletlen volt. Mindegyik „szóról szóra”, „kifejezésről kifejezésre” egymást követő fordítási algoritmusokon alapult - a szavak és mondatok közötti szemantikai kapcsolatokat semmilyen módon nem vették figyelembe. Például megadhatja a következő mondatokat: „John a játékdobozát kereste. Végül megtalálta. A doboz a tollban volt. János nagyon boldog volt. (John a játékdobozát kereste. Végül megtalálta. A doboz a járókában volt. John nagyon boldog volt.)” A „toll” ebben az összefüggésben nem „toll” (íróeszköz), hanem „járóka” (játszótoll). A szinonimák, antóniák és átvitt jelentések ismeretét nehéz bevinni a számítógépbe. Ígéretes irány volt a humán fordító általi használatra szánt gépi rendszerek fejlesztése.

Idővel a közvetlen fordítási rendszereket felváltották a T-rendszerek (az angol „transzfer” szóból - transzformáció), amelyekben a fordítást a szintaktikai struktúrák szintjén hajtották végre. A T-rendszer algoritmusai olyan mechanizmust használtak, amely lehetővé tette számukra, hogy a bemeneti mondat nyelvének nyelvtanának szabályai szerint szintaktikai struktúrát építsenek fel (hasonlóan ahhoz, ahogy a középiskolában idegen nyelvet tanítanak), majd szintetizálják a kimeneti mondatot, a szintaktikai szerkezet átalakítása és a szükséges szavak helyettesítése a szótárból.

Ljapunov a fordításról úgy beszélt, hogy kivonja a lefordított szöveg jelentését, és egy másik nyelven bemutatja. Még mindig a legfejlettebbnek tekinthető a gépi fordítói rendszerek felépítésének megközelítése, amely egy bemeneti mondat szemantikai reprezentációjának megszerzésén alapul a szemantikai elemzés és a bemeneti mondat szintézise révén a kapott szemantikai reprezentáció alapján. Az ilyen rendszereket I-rendszereknek nevezik (az „interlingua” szóból). Az 50-es évek végén és a 60-as évek elején keletkezett megalkotásuk feladata azonban az információfeldolgozás területén tevékenykedő globális tudósközösség, az IFIP Nemzetközi Szövetség erőfeszítései ellenére még mindig nem teljesen megoldott.

A tudósok azon gondolkodtak, hogyan formalizálják és építsenek algoritmusokat a szövegekkel való munkavégzéshez, milyen szótárakat kell bevinni a gépbe, milyen nyelvi mintákat kell használni a gépi fordítás során. A hagyományos nyelvészetnek nem voltak ilyen elképzelései - nemcsak szemantikai, hanem szintaktikai szempontból sem. Akkoriban egyetlen nyelv esetében sem léteztek szintaktikai struktúrák listája, kompatibilitásuk és felcserélhetőségük feltételeit nem vizsgálták, és nem dolgoztak ki szabályokat a kisebb alkotóelemekből nagy szintaktikai szerkezeti egységek felépítésére.

A gépi fordítás elméleti alapjainak megteremtésének igénye a matematikai nyelvészet kialakulásához és fejlődéséhez vezetett. A Szovjetunióban ebben a kérdésben a vezető szerepet a matematikusok játszották A.A. Ljapunov, O.S. Kulagina, V.A. Uszpenszkij, nyelvészek V. Yu. Rosenzweig, P.S. Kuznyecov, R.M. Frumkina, A.A. Reformatsky, I.A. Melchuk, V.V. Ivanov. Kulagina disszertációját a nyelvtan formális elméletének tanulmányozásának szentelte (N. Chomskyval egyidejűleg az USA-ban), Kuznyecov a nyelvészet axiomatizálásának problémáját vetette fel F. F. munkáira visszanyúlva. Fortunatova.

1960. május 6-án elfogadták a Szovjetunió Tudományos Akadémia Elnökségének határozatát „A nyelvkutatás strukturális és matematikai módszereinek kidolgozásáról”, és megfelelő részlegeket hoztak létre a Nyelvtudományi Intézetben és az Orosz Nyelvi Intézetben. 1960 óta az ország vezető humanitárius egyetemei - a Moszkvai Állami Egyetem Filológiai Kara, Leninrad, Novoszibirszki Egyetemek, Moszkvai Állami Idegennyelvi Pedagógiai Intézet - megkezdték a személyzet képzését az automatikus szövegfeldolgozás területén.

Azonban a gépi fordítással kapcsolatos munka ebből az időszakból, amelyet „klasszikusnak” neveznek, inkább elméleti, mint gyakorlati érdeklődésre tart számot. Költséghatékony gépi fordítórendszereket csak a múlt század nyolcvanas éveiben kezdtek létrehozni. Erről később, a 2.1-es, „Gépi fordítás” részben fogok beszélni.

Az 1960-as és 70-es években mély elméleti fejlődés ment végbe a halmazelmélet és a matematikai logika módszereivel, mint például a mezőelmélet és a fuzzy halmazelmélet.

A nyelvtudományi terepelmélet szerzője a szovjet költő, fordító és nyelvész V.G. Admony. Elméletét kezdetben a német nyelv alapján dolgozta ki. Az Admoniban a „mező” fogalma a nyelvi elemek tetszőleges, nem üres halmazát jelöli (például „lexikális mező”, „szemantikai mező”).

A mező szerkezete heterogén: egy magból áll, melynek elemei a halmazt meghatározó jellemzők teljes halmazával rendelkeznek, és egy perifériából, amelynek elemei rendelkezhetnek egy adott halmaz jellemzőivel (nem mindegyik) és a szomszédosak. Hadd mondjak egy példát ennek az állításnak az illusztrálására: mondjuk az angolban az összetett szavak mezőjét („day-dream” - „dream” nehéz elkülöníteni a kifejezések mezőjétől („könnygáz”).

A fuzzy halmazok fentebb már említett elmélete szorosan kapcsolódik a térelmélethez. A Szovjetunióban ennek alátámasztását V.G. nyelvészek végezték. Admoni, I.P. Ivanova, G.G. Pochencov, de alapítója L. Zade amerikai matematikus volt, aki 1965-ben publikálta a „Fuzzy Logic” című cikket. Zadeh a fuzzy halmazok elméletének matematikai igazolását a nyelvi anyag felhasználásával vette figyelembe.

Ebben az elméletben nem annyira az elemek adott halmazhoz való tartozásáról (AOa) beszélünk, hanem ennek a tagságnak a mértékéről (mAOa), hiszen a perifériás elemek ilyen vagy olyan mértékben több területhez is tartozhatnak. Zade (Lofti-zade) Azerbajdzsánban született, 12 éves koráig négy nyelven - azerbajdzsáni, orosz, angol és perzsa - kommunikált, és három különböző ábécét használt: cirill, latin, arab. Amikor egy tudóst megkérdeznek, mi a közös a fuzzy halmazelméletben és a nyelvészetben, nem tagadja ezt az összefüggést, de pontosítja: „Nem vagyok benne biztos, hogy ezeknek a nyelveknek a tanulmányozása nagy hatással volt a gondolkodásomra. Ha ez megtörtént, az talán tudat alatt történt.” Fiatalkorában Zadeh Teheránban tanult egy presbiteriánus iskolában, majd a második világháború után az Egyesült Államokba emigrált. „A kérdés nem az, hogy amerikai, orosz, azerbajdzsáni vagy bármi más vagyok” – mondta

Hasonló absztraktok:

A nyelv és a beszéd, mint a stilisztika egyik alapvető problémája. A fonéma és a fonológiai szint fogalma. A nyelv mint rendszer fogalma és a nyelvi rendszer szintjei. A morfémák fogalma és típusai. A mondat, mint a szöveg szintaktikai egysége. A nyelvi rendszer jelei.

A szerkezeti nyelvészet kialakulása a 19-20. század fordulóján. Statisztikai módszerek a nyelvtanulásban. Matematikai módszerek alkalmazása a nyelvészetben a huszadik század második felében. Nyelvtanulás formális logikai módszerekkel. A gépi fordítás jellemzői.

BEVEZETÉS

1. fejezet A matematikai módszerek nyelvtudományi alkalmazásának története

1.1. A szerkezeti nyelvészet kialakulása a 19-20. század fordulóján

1.2. Matematikai módszerek alkalmazása a nyelvészetben a huszadik század második felében

2. fejezet Válogatott példák a matematika nyelvtudományi felhasználására

2.1. Gépi fordítás

2.2.Statisztikai módszerek a nyelvtanulásban

2.3. Nyelvtanulás formális logikai módszerekkel

2.4. A matematikai módszerek nyelvtudományi alkalmazásának távlatai

Következtetés

Irodalom

1. melléklet Ronald Schleifer. Ferdinand de Saussure

2. függelék Ferdinand de Saussure (fordítás)

BEVEZETÉS

A huszadik században folytatódott a különböző tudásterületek interakciója és áthatolása felé irányuló tendencia. Az egyes tudományok közötti határok fokozatosan elmosódnak; Egyre több iparág jelenik meg mentális tevékenység, amely a humanitárius, műszaki és természettudományi ismeretek metszéspontjában található.

A modernitás másik nyilvánvaló vonása a struktúrák és alkotóelemeik tanulmányozásának vágya. Ezért mind a tudományelméletben, mind a gyakorlatban egyre nagyobb teret kap a matematika. Egyrészt a logikával és a filozófiával, másrészt a statisztikával (és ennek következtében a társadalomtudományokkal) érintkezve a matematika egyre mélyebbre hatol azokra a területekre, amelyeket sokáig tisztán „humanitáriusnak tartottak, ” heurisztikus potenciáljuk bővítése (a „mennyit” kérdésre adott válasz gyakran segít a „mit” és a „hogyan” kérdések megválaszolásában. A nyelvészet sem volt kivétel.

Tantárgyi munkám célja, hogy röviden rávilágítsak a matematika és a nyelvtudomány egy olyan ága, mint a nyelvészet kapcsolatára. A múlt század 50-es évei óta a matematikát a nyelvészetben használták a nyelvek (természetes és mesterséges) szerkezetének leírására szolgáló elméleti apparátus létrehozására. Azt kell mondani, hogy nem talált azonnal ilyen gyakorlati alkalmazást. Kezdetben a nyelvészetben a matematikai módszereket kezdték alkalmazni a nyelvtudományi alapfogalmak tisztázására, de a számítástechnika fejlődésével egy ilyen elméleti előfeltevés a gyakorlatban is elkezdődött. Az olyan problémák megoldása, mint a gépi fordítás, a gépi információkeresés és az automatikus szövegfeldolgozás, alapvetően új nyelvi megközelítést igényelt. Felmerült a kérdés a nyelvészekben: hogyan lehet megtanulni a nyelvi mintákat olyan formában ábrázolni, hogy azok közvetlenül alkalmazhatók legyenek a technológiában. A korunkban elterjedt „matematikai nyelvészet” kifejezés minden olyan nyelvészeti kutatásra vonatkozik, amely egzakt módszereket alkalmaz (és a tudományban az egzakt módszerek fogalma mindig szorosan összefügg a matematikával). Az elmúlt évek tudósai egy része úgy véli, hogy magát a kifejezést nem lehet egy kifejezés rangjára emelni, hiszen nem jelöl semmiféle speciális „nyelvészetet”, csak egy új irányt, amely a nyelvkutatási módszerek javítására, pontosságának és megbízhatóságának növelésére irányul. A nyelvészet kvantitatív (algebrai) és nem kvantitatív módszereket egyaránt alkalmaz, ami közelebb viszi a matematikai logikához, következésképpen a filozófiához, sőt a pszichológiához is. Schlegel is felhívta a figyelmet a nyelv és a tudat kölcsönhatására, és a huszadik század elejének kiemelkedő nyelvésze, Ferdinand de Saussure (a nyelvtudományi matematikai módszerek fejlődésére gyakorolt ​​hatásáról a későbbiekben szólok) a nyelv szerkezetét összekapcsolta egy nyelvhez való tartozásával. emberek. L. Perlovsky modern kutató tovább megy, egy nyelv kvantitatív jellemzőit (például nemek számát, esetek számát) a nemzeti mentalitás jellemzőivel azonosítja (erről bővebben a 2.2. „Nyelvtudományi statisztikai módszerek” című részben).

A matematika és a nyelvészet kölcsönhatása sokrétű téma, munkámban nem mindegyikre, hanem mindenekelőtt annak alkalmazott vonatkozásaira térek ki.

I. fejezet.A matematikai módszerek nyelvtudományi alkalmazásának története

1.1 A szerkezeti nyelvészet megjelenéseszázad fordulóján – a 19-20

A nyelv matematikai leírása a nyelv mint mechanizmus elgondolásán alapul, amely a huszadik század elejének híres svájci nyelvészéhez, Ferdinand de Saussure-hoz nyúlik vissza.

Koncepciójának kiinduló láncszeme a nyelv elmélete, mint három részből álló rendszer (maga a nyelv - nyelv, beszéd - Jelszóés beszédtevékenység - nyelvet), amelyben minden szót (a rendszer tagját) nem önmagában, hanem más tagokkal összefüggésben tekintjük. Amint egy másik kiemelkedő nyelvész, a dán Louis Hjelmslev később megjegyezte, Saussure „volt az első, aki a nyelv strukturális megközelítését követelte, azaz tudományos leírás nyelvet az egységek közötti kapcsolatok regisztrálásával."

A nyelvet hierarchikus struktúraként értelmezve Saussure volt az első, aki felvetette a nyelvi egységek értékének és jelentőségének problémáját. Az egyes jelenségeket, eseményeket (mondjuk az egyes indoeurópai szavak keletkezésének történetét) nem önmagukban kell tanulmányozni, hanem olyan rendszerben, amelyben hasonló összetevőkkel korrelálnak.

Saussure a nyelv szerkezeti egységének a szót, a „jelet” tekintette, amelyben a hang és a jelentés egyesült. Ezek az elemek egyike sem létezik egymás nélkül: ezért az anyanyelvi beszélő egy poliszemantikus szó különböző jelentésárnyalatait a szerkezeti egészben, a nyelvben különálló elemként érti.

F. de Saussure elméletében tehát látható a nyelvészet kölcsönhatása egyrészt a szociológiával és a szociálpszichológiával (megjegyzendő, hogy egy időben alakult ki Husserl fenomenológiája, Freud pszichoanalízise, ​​Einstein relativitáselmélete irodalomban, zenében és képzőművészetben formai és tartalommal kapcsolatos kísérletek folynak, másrészt - matematikával (a rendszeresség fogalma a nyelv algebrai fogalmának felel meg). Ez a fogalom megváltoztatta a nyelvi értelmezés fogalmát mint olyat: a jelenségeket nem előfordulásuk okaihoz viszonyítva kezdték értelmezni, hanem a jelenhez és a jövőhöz viszonyítva. Az értelmezés már nem független az ember szándékaitól (annak ellenére, hogy a szándékok lehetnek személytelenek, a szó freudi értelmében „tudattalanok”).

A nyelvi mechanizmus működése az anyanyelvi beszélők beszédtevékenységén keresztül nyilvánul meg. A beszéd eredménye az úgynevezett „helyes szövegek” - beszédegységek sorozatai, amelyek engedelmeskednek bizonyos mintáknak, amelyek közül sok lehetővé teszi a matematikai leírást. A szintaktikai struktúra leírására szolgáló módszerek elmélete a helyes szövegek (elsősorban mondatok) matematikai leírásának módszereivel foglalkozik. Egy ilyen struktúrában a nyelvi analógiákat nem az eredendő tulajdonságaik, hanem a rendszerszerű („strukturális”) kapcsolatok segítségével határozzák meg.

Nyugaton Saussure gondolatait a nagy svájci nyelvész fiatalabb kortársai dolgozzák ki: Dániában – a már említett L. Hjelmslev –, aki „A nyelvelmélet alapjai” című munkájában az algebrai nyelvelméletet szülte, az USA-ban – E. Sapir, L. Bloomfield, C. Harris, Csehországban - N. Trubetskoy orosz emigráns tudós.

A nyelvtanulás statisztikai mintáit nem más kezdte el tanulmányozni, mint a genetika megalapítója, Georg Mendel. A filológusok csak 1968-ban fedezték fel, hogy élete utolsó éveiben szívesen tanulmányozta a nyelvi jelenségeket matematikai módszerekkel. Mendel ezt a módszert a biológiából hozta a nyelvészetbe; a 19. század kilencvenes éveiben csak a legmerészebb nyelvészek és biológusok nyilatkoztak egy ilyen elemzés megvalósíthatóságáról. A Szt. kolostor archívumában. Tomas Brünnben, ahol Mendel apát volt, lapokat találtak „mann”, „bauer”, „mayer” végződésű vezetéknevek oszlopaival, valamint néhány törtszámmal és számítással. Mendel a családnevek eredetének formai törvényszerűségeinek feltárása érdekében összetett számításokat végez, amelyek során figyelembe veszi a német nyelv magán- és mássalhangzóinak számát, az általa figyelembe vett szavak teljes számát, a vezetéknevek számát, stb.

Nálunk a szerkezeti nyelvészet megközelítőleg a nyugatival egy időben - a 19-20. század fordulóján - kezdett kialakulni. F. de Saussure-ral egyidőben a nyelv mint rendszer fogalmát a kazanyi egyetem professzora, F.F. Fortunatov és I.A. Baudouin de Courtenay. Utóbbi ennek megfelelően hosszú ideig levelezett de Saussure-ral, a genfi ​​és a kazanyi nyelvészeti iskola együttműködött egymással. Ha Saussure-t a nyelvészet „egzakt” módszereinek ideológusának nevezhetjük, akkor ezek alkalmazásának gyakorlati alapjait Baudouin de Courtenay fektette le. Ő volt az első, aki különválasztotta a nyelvészetet (pl pontos statisztikai módszereket és funkcionális függőséget alkalmazó tudomány) a filológián (a spirituális kultúrát nyelven és beszéden keresztül vizsgáló humanitárius tudományágak közössége). Maga a tudós úgy vélte, hogy „a nyelvészet csak akkor lehet hasznos a közeljövőben, ha megszabadul a filológiával és az irodalomtörténettel való kötelező egyesüléstől”. " Teszt helyszín„A fonológia lett a matematikai módszerek nyelvtudományi bevezetésének alapja - a hangok, mint a nyelvi rendszer „atomjai”, korlátozott számú, könnyen mérhető tulajdonsággal rendelkező hangok voltak a legkényelmesebb anyag a formális, szigorú leírási módszerekhez. A fonológia tagadja a hang jelentésének jelenlétét, így a kutatás során az „emberi” tényezőt kiiktatták. Ebben az értelemben a fonémák olyanok, mint a fizikai vagy biológiai tárgyak.

A fonémák, mint az észlelés számára elfogadható legkisebb nyelvi elemek, külön szférát, külön „fenomenológiai valóságot” képviselnek. Például be angol nyelv A "t" hang többféleképpen ejthető, de az angolul beszélő személy minden esetben "t"-ként fogja fel. A lényeg az, hogy a fonéma teljesítse fő - szemantikai-megkülönböztető - funkcióját. Ezen túlmenően a nyelvek közötti különbségek olyanok, hogy az egyik hang változatai egy nyelven különböző fonémáknak felelhetnek meg egy másikban; például az „l” és az „r” különbözik az angolban, míg más nyelveken ugyanannak a fonémának a változatai (mint például az angol „t”, aspirated vagy unaspirated kiejtése). Bármely természetes nyelv hatalmas szókincse sokkal kisebb számú fonéma kombinációinak gyűjteménye. Az angolban például csak 40 fonémát használnak körülbelül egymillió szó kiejtésére és írására.

A nyelv hangjai a jellemzők szisztematikusan szervezett halmazát képviselik. Az 1920-as és 1930-as években, Saussure nyomán, Jacobson és N. S. Trubetskoy azonosította a fonémák „megkülönböztető vonásait”. Ezek a tulajdonságok a beszédszervek - nyelv, fogak, hangszálak - szerkezetén alapulnak. Mondjuk, angolul a „t” és a „d” közötti különbség a „hang” jelenléte vagy hiánya (a hangszálak feszültsége) és a hangszint, amely megkülönbözteti az egyik fonémát a másiktól. Így a fonológia egy Saussure által leírt általános nyelvi szabály példájának tekinthető: „A nyelvben csak különbségek vannak”. Még csak nem is ez a fontos: a különbség általában magában foglalja azokat a pontos feltételeket, amelyek között van; de a nyelvben csak különbségek vannak pontos feltételek nélkül. Mindegy, hogy „jelesnek” vagy „jelzettnek” tekintjük – a nyelvben nincsenek olyan fogalmak vagy hangok, amelyek a nyelvi rendszer kialakulása előtt léteztek.

Így a Saussure-i nyelvészetben a vizsgált jelenséget a nyelv összehasonlításának és ellentéteinek összességeként értelmezik. A nyelv a szavak jelentésének kifejezője és kommunikációs eszköze is, és ez a két funkció soha nem esik egybe. Észrevehető a forma és a tartalom váltakozása: a nyelvi ellentétek határozzák meg szerkezeti egységeit, és ezek az egységek kölcsönhatásban hoznak létre egy bizonyos értelmes tartalmat. Mivel a nyelv elemei véletlenszerűek, sem kontraszt, sem kombináció nem lehet az alap. Ez azt jelenti, hogy egy nyelvben a megkülönböztető jegyek fonetikai kontrasztot alkotnak a megértés különböző szintjén, a fonémák morfémákká, a morfémák szavakká, a szavak mondatokká stb. Mindenesetre egy egész fonéma, szó, mondat stb. több, mint részeinek összege.

Saussure egy új, a nyelvészettől elkülönülő, huszadik századi tudomány ötletét javasolta, amely a jelek társadalomban betöltött szerepét vizsgálja. Saussure ezt a tudományt szemiológiának nevezte (a görög „semeion” - jelből). Az 1920-as és 1930-as években Kelet-Európában, az 1950-es és 1960-as években Párizsban kifejlődött szemiotika "tudománya" kiterjesztette a nyelv és a nyelvi struktúrák vizsgálatát az e struktúrák felhasználásával megkomponált (vagy megfogalmazott) irodalmi eredményekre. Emellett Saussure pályafutása alkonyán, általános nyelvészeti kurzusával párhuzamosan elkezdte a késő római költészet „szemiotikai” elemzését, megpróbálva felfedezni a tulajdonnevek szándékosan megkomponált anagrammáit. Ez a módszer nyelvi elemzésében sok tekintetben a racionalizmus ellentéte volt: kísérlet volt a nyelvi „valószínűség” problémájának egy rendszerben történő tanulmányozására. Az ilyen kutatások segítenek a valószínűség „anyagi oldalára” összpontosítani; „A kulcsszó”, amelynek anagrammáját Saussure keresi, ahogy Jean Starobinsky állítja, „a költő eszközét, és nem a vers életének forrását”. A vers a kulcsszó hangjainak megfordítására szolgál. Starobinsky szerint ebben az elemzésben "Saussure nem mélyed el a rejtett jelentések keresésében". Éppen ellenkezőleg, műveiben észrevehető a tudattal kapcsolatos kérdések elkerülésének vágya: „mivel a költészet nemcsak szavakban fejeződik ki, hanem abban is, amit ezek a szavak generálnak, túlmutat a tudat irányításán, és csak a törvényektől függ. nyelvről” (lásd . 1. melléklet).

Saussure azon kísérlete, hogy a késő római költészet tulajdonneveit tanulmányozza, kiemeli nyelvi elemzésének egyik összetevőjét – a jelek önkényes voltát, valamint Saussure nyelvészetének formai lényegét, amely kizárja a jelentéselemzés lehetőségét. Todorov arra a következtetésre jut, hogy Saussure munkái manapság szokatlanul következetesnek tűnnek abban, hogy vonakodnak egy jelenség világosan meghatározott jelentésű szimbólumait tanulmányozni [1. melléklet]. Az anagrammák tanulmányozása során Saussure csak az ismétlésre figyel, a korábbi változatokra nem. . . . A Nibelungok tanulmányozása során a szimbólumokat csak azért azonosítja, hogy hibás olvasatokhoz rendelje őket: ha nem szándékosak, akkor nem léteznek szimbólumok. Hiszen általános nyelvészeti írásaiban egy olyan szemiológia létezését sugallja, amely nemcsak nyelvi jeleket ír le; de ennek a feltételezésnek az a tény korlátozza, hogy a szemiológia csak véletlenszerű, önkényes jeleket tud leírni.

Ha ez valóban így van, csak azért, mert nem tudta elképzelni a „szándékot” tárgy nélkül; nem tudta teljesen leküzdeni a forma és a tartalom közötti szakadékot - műveiben ez kérdéssé vált. Ehelyett a „nyelvi törvényességre” hivatkozott. Egyrészt a tizenkilencedik századi történelemre és szubjektív sejtésre épülő fogalmak, másrészt az ezekre épülő esetleges értelmezési módszerek, másrészt a forma és a tartalom ellentétét eltörlő strukturalista fogalmak (szubjektív, ill. tárgy), jelentés és eredet a strukturalizmusban, a pszichoanalízisben, sőt a kvantummechanikában – Ferdinand de Saussure nyelvészetről és szemiotikáról szóló írásai fordulópontot jelentenek a nyelv és a kultúra jelentésének vizsgálatában.

Az 1928-as hágai első nemzetközi nyelvészkongresszuson orosz tudósok is képviseltették magukat. S. Kartsevsky, R. Jacobson és N. Trubetskoy jelentést készített, amely a nyelv hierarchikus szerkezetét vizsgálta - a múlt század eleji legmodernebb eszmék jegyében. Jacobson munkáiban kidolgozta Saussure gondolatait, miszerint a nyelv alapelemeit mindenekelőtt funkciójukkal, nem pedig előfordulásuk okaival összefüggésben kell tanulmányozni.

Sajnos Sztálin 1924-es hatalomra kerülése után a hazai nyelvészet – sok más tudományhoz hasonlóan – visszaszorult. Sok tehetséges tudós emigrációba kényszerült, kiutasították az országból, vagy táborokban haltak meg. Csak az 1950-es évek közepétől vált lehetségessé az elméletek pluralizmusa – erről bővebben az 1.2. részben.

1.2 A matematikai módszerek alkalmazása a nyelvészetben a huszadik század második felében

A huszadik század közepére négy világnyelvi iskola alakult ki, amelyek mindegyike egy-egy „egzakt” módszer ősének bizonyult. Leningrádi Fonológiai Iskola(alapítója Baudouin de Courtenay tanítványa, L. V. Shcherba) az anyanyelvi beszélők beszédének elemzésén alapuló pszicholingvisztikai kísérletet használt a hang fonéma formájában történő általánosításának fő kritériumaként.

Tudósok Prágai Nyelvtudományi Kör, különösen - alapítója N.S. Az Oroszországból emigrált Trubetskoy kidolgozta az oppozíciók elméletét - a nyelv szemantikai szerkezetét ők oppozíciósan felépített szemantikai egységek halmazaként írták le - szemem. Ezt az elméletet nemcsak a nyelv, hanem a művészi kultúra tanulmányozásában is használták.

Ideológusok Amerikai deskriptivizmus voltak L. Bloomfield és E. Sapir nyelvészek. A nyelvet beszédmegnyilatkozások összességeként mutatták be a deskriptivistáknak, amelyek kutatásaik fő tárgyát képezték. Fókuszban a szövegek tudományos leírásának (innen a név) szabályai álltak: elemeik szervezésének, elrendezésének, osztályozásának vizsgálata. Az analitikai eljárások formalizálása a fonológia és morfológia területén (a nyelv különböző szintű tanulmányozásának elveinek kidolgozása, eloszlásanalízis, a közvetlen komponensek módszere stb.) a nyelvi modellezés általános kérdéseinek megfogalmazásához vezetett. A nyelv tartalmi terve iránti figyelmetlenség, valamint a nyelv paradigmatikus oldala nem tette lehetővé a deskriptivisták számára, hogy a nyelvet rendszerként teljes mértékben értelmezzék.

Az 1960-as években kialakult a formális nyelvtan elmélete, amely főként N. Chomsky amerikai filozófus és nyelvész munkáinak köszönhető. Joggal tekintik az egyik leghíresebb modern tudósnak és közéleti személyiségnek, számos cikket, monográfiát és még egy egész estés filmet is szentelnek neki. dokumentumfilm. A Chomsky által kitalált, alapvetően új szintaktikai struktúra leírása - generatív (generatív) grammatika - után a megfelelő nyelvészeti irányzatot nevezték el. generativizmus.

Chomsky, oroszországi bevándorlók leszármazottja, 1945-től nyelvészetet, matematikát és filozófiát tanult a Pennsylvaniai Egyetemen, tanára, Zelig Harris nagy hatással rá – ahogyan Harris is, Chomsky is hitte és tartja Politikai nézetek közel áll az anarchizmushoz (máig az USA létező politikai rendszerének kritikusaként és az antiglobalizmus egyik szellemi vezetőjeként ismert).

Chomsky első jelentős tudományos munkája, diplomamunkája „A modern héber morfológiája » (1951), kiadatlan maradt. Chomsky 1955-ben doktorált a Pennsylvaniai Egyetemen, de a disszertációjának alapjául szolgáló kutatások nagy része (teljes egészében csak 1975-ben jelent meg „A nyelvelmélet logikai szerkezete” címmel) és első monográfiája, a „Syntactic” Structures” (Syntactic Structures, 1957, orosz. ford. 1962), a Harvard Egyetemen adták elő 1951-1955 között. Ugyanebben 1955-ben a tudós a Massachusetts Institute of Technology-ba költözött, ahol 1962-ben professzor lett.

Kidolgozása során Chomsky elmélete több szakaszon ment keresztül.

Első monográfiájában, a „Syntactic Structures”-ben a tudós a nyelvet olyan mechanizmusként mutatta be, amely végtelen számú mondat generálására alkalmas nyelvtani eszközök véges halmazával. A nyelvi tulajdonságok leírására javasolta a mély (közvetlen észlelés elől elrejtett és rekurzív, azaz ismételten alkalmazható szabályok rendszere által generált) és felszíni (közvetlenül észlelhető) nyelvtani struktúrák fogalmait, valamint az átmenetet leíró transzformációkat. mély struktúrákból felszínre. Egy mélyszerkezet több felszíni szerkezetnek is megfelelhet (például egy passzív szerkezet A rendeletet az elnök írja alá ugyanabból a mélyszerkezetből származik, mint az aktív konstrukció Az elnök rendeletet ír alá) és fordítva (tehát a kétértelműség Anya szereti a lányát egy véletlen eredményeként írják le felületi struktúrák, két különböző mélységbe nyúlva vissza, amelyek közül az egyikben az anya az, aki szereti a lányát, a másikban pedig az, akit a lánya szeret).

Chomsky standard elmélete az Aspektus-modell, amelyet Chomsky Aspects of the Theory of Syntax című könyvében fejt ki. Ebben a modellben kerültek be először a formális elméletbe a mélystruktúráknak értelmet adó szemantikai értelmezési szabályok. Az „Aspektusokban” a nyelvi kompetencia a nyelvhasználattal (teljesítmény) áll szemben, átveszi az úgynevezett Katz-Postal hipotézist a jelentés megőrzéséről az átalakulás során, ezért az opcionális transzformáció fogalma kizárt, és az apparátus bemutatott szintaktikai jellemzők, lexikális kompatibilitást leíró.

Az 1970-es években Chomsky az ellenőrzés és a kötés elméletén dolgozott (GB-elmélet - a szavakból kormányÉs kötés) - általánosabb, mint az előző. Ebben a tudós elhagyta az egyes nyelvek szintaktikai struktúráit leíró specifikus szabályokat. Minden transzformációt egyetlen univerzális mozgástranszformáció váltott fel. A GB elmélet keretein belül vannak privát modulok is, amelyek mindegyike felelős a saját nyelvtani részéért.

Chomsky még 1995-ben egy minimalista programot terjesztett elő, amelyben az emberi nyelvet a gépi nyelvhez hasonlónak írják le. Ez csak egy program – nem modell vagy elmélet. Ebben Chomsky az emberi nyelvi apparátus két fő alrendszerét azonosítja: a lexikont és a számítástechnikai rendszert, valamint két interfészt - fonetikus és logikai.

A Chomsky formális nyelvtanai klasszikussá váltak nemcsak a természetes, hanem a mesterséges nyelvek – különösen a programozási nyelvek – leírására is. A strukturális nyelvészet fejlődése a huszadik század második felében joggal tekinthető „chomsky-i forradalomnak”.

Moszkvai Fonológiai Iskola, amelynek képviselői A.A. Reformatsky, V.N. Sidorov, P.S. Kuznyecov, A.M. Sukhotin, R.I. Avanesov hasonló elméletet alkalmazott a fonetika tanulmányozására. Fokozatosan a „pontos” módszereket nemcsak a fonetikára, hanem a szintaxisra is alkalmazni kezdik. Mind a nyelvészek, mind a matematikusok itthon és külföldön egyaránt elkezdik tanulmányozni a nyelv szerkezetét. Az 1950-60-as években a matematika és a nyelvészet kölcsönhatásának új szakasza kezdődött a Szovjetunióban, a gépi fordítási rendszerek fejlődésével összefüggésben.

E munka megkezdéséhez hazánkban a gépi fordítás területén az Egyesült Államokban történt első fejlemények adták a lendületet (bár P. P. Smirnov-Troyansky első gépesített fordítóeszközét a Szovjetunióban találták fel 1933-ban, ez primitív volt, nem terjedt el széles körben). 1947-ben A. Butt és D. Britten kidolgozott egy kódot a számítógépes szavankénti fordításhoz, egy évvel később R. Richens egy szabályt javasolt a szavak tövekre és végződésekre való felosztására a gépi fordításban. Ezek az évek egészen mások voltak, mint a maiak. Ezek nagyon nagy és drága gépek voltak, amelyek egész helyiségeket foglaltak el, és nagyszámú mérnököt, kezelőt és programozót igényeltek a karbantartásukhoz. Ezekkel a számítógépekkel alapvetően a katonai intézmények igényeinek megfelelő matematikai számításokat végeztek – a matematika, a fizika és a technika újdonságai elsősorban a katonai ügyeket szolgálták. Az MP fejlesztését a korai szakaszban a katonaság aktívan támogatta, mindezzel (a hidegháború körülményei között) az USA-ban az orosz-angol, a Szovjetunióban pedig az angol-orosz irányvonal alakult ki.

1954 januárjában a „Georgetown Experiment”-re a Massachusettsi Műszaki Egyetemen került sor – az orosz nyelvről angolra fordítás első nyilvános bemutatója egy IBM-701 gépen. A kísérlet sikeres befejezéséről szóló üzenet kivonata, amelyet D.Yu. Panov, megjelent a Russian Journal of Mathematics, 1954, 10. számban: „Fordítás egyik nyelvről a másikra gép segítségével: jelentés az első sikeres tesztről.”

D. Yu Panov (akkoriban a Tudományos Információs Intézet - INI, később VINITI igazgatója) bevonta I. K. Belskaya-t, hogy a gépi fordítással foglalkozzon, aki később a Precíziós Matematikai és Számítástechnikai Intézet gépi fordítási csoportját vezette. Szovjetunió Tudományos Akadémia. Az angolról oroszra történő fordítás első tapasztalata a BESM gép segítségével 1955 végére nyúlik vissza. A BESM programjait az N.P. Trifonov és L.N. Koroljov, akinek doktori disszertációját a gépi fordításhoz szükséges szótárak készítésének módszereivel foglalkozott.

Ezzel párhuzamosan a Szovjetunió Tudományos Akadémia Matematikai Intézetének (jelenleg az Orosz Tudományos Akadémia M. V. Keldysh Alkalmazott Matematikai Intézetének) Alkalmazott Matematikai Osztályán gépi fordítással kapcsolatos munkát végeztek. A matematikus A.A. kezdeményezésére. Ljapunova. A Steklov Matematikai Intézet végzős hallgatóját bevonta a szövegek fordításába a Strela géppel franciáról oroszra. Kulagin és tanítványai T.D. Ventzel és N.N. Ricco. Ljapunov és Kulagina ötleteit a technológia felhasználásának lehetőségéről az egyik nyelvről a másikra történő fordításhoz a Nature folyóiratban tették közzé, 1955, 8. szám. 1955 vége óta csatlakozott hozzájuk T.N. Moloshnaya, aki ezután önálló munkát kezdett egy angol-orosz fordítási algoritmuson.

R. Frumkina, aki akkoriban spanyol nyelvű algoritmikus fordítással foglalkozott, úgy emlékszik vissza, hogy a munka ezen szakaszában nehéz volt következetes lépéseket tenni. Sokkal gyakrabban kellett heurisztikus tapasztalatokat követnem - a saját vagy a kollégáim tapasztalatait.

A gépi fordítórendszerek első generációja azonban nagyon tökéletlen volt. Mindegyik „szóról szóra”, „kifejezésről kifejezésre” egymást követő fordítási algoritmusokon alapult - a szavak és mondatok közötti szemantikai kapcsolatokat semmilyen módon nem vették figyelembe. Például a következő mondatok adhatók: „ John a játékdobozát kereste.Végül megtalálta. A doboz a tollban volt.János nagyon boldog volt. (John a játékdobozát kereste. Végül megtalálta. A doboz a járókában volt. John nagyon boldog volt.)” A „toll” ebben az összefüggésben nem „toll” (íróeszköz), hanem „járóka” ( járóka). A szinonimák, antóniák és átvitt jelentések ismeretét nehéz bevinni a számítógépbe. Ígéretes irány volt a humán fordító általi használatra szánt gépi rendszerek fejlesztése.

Idővel a közvetlen fordítási rendszereket felváltották a T-rendszerek (az angol „transzfer” szóból - transzformáció), amelyekben a fordítást a szintaktikai struktúrák szintjén hajtották végre. A T-rendszer algoritmusai olyan mechanizmust használtak, amely lehetővé tette számukra, hogy a bemeneti mondat nyelvének nyelvtanának szabályai szerint szintaktikai struktúrát építsenek fel (hasonlóan ahhoz, ahogy a középiskolában idegen nyelvet tanítanak), majd szintetizálják a kimeneti mondatot, a szintaktikai szerkezet átalakítása és a szükséges szavak helyettesítése a szótárból.

Ljapunov a fordításról úgy beszélt, hogy kivonja a lefordított szöveg jelentését, és egy másik nyelven bemutatja. Még mindig a legfejlettebbnek tekinthető a gépi fordítói rendszerek felépítésének megközelítése, amely egy bemeneti mondat szemantikai reprezentációjának megszerzésén alapul a szemantikai elemzés és a bemeneti mondat szintézise révén a kapott szemantikai reprezentáció alapján. Az ilyen rendszereket I-rendszereknek nevezik (az „interlingua” szóból). Ugyanakkor az 50-es évek végén - a 60-as évek elején megalkotásuk feladatát az IFIP Nemzetközi Szövetség – az információfeldolgozás területén tevékenykedő globális tudósközösség – erőfeszítései ellenére még nem sikerült teljesen megoldani.

A tudósok azon gondolkodtak, hogyan formalizálják és építsenek algoritmusokat a szövegekkel való munkavégzéshez, milyen szótárakat kell bevinni a gépbe, milyen nyelvi mintákat kell használni a gépi fordítás során. A hagyományos nyelvészetnek nem voltak ilyen elképzelései - nemcsak szemantikai, hanem szintaktikai szempontból sem. Akkoriban egyetlen nyelv esetében sem léteztek szintaktikai struktúrák listája, kompatibilitásuk és felcserélhetőségük feltételeit nem vizsgálták, és nem dolgoztak ki szabályokat a kisebb alkotóelemekből nagy szintaktikai szerkezeti egységek felépítésére.

A gépi fordítás elméleti alapjainak megteremtésének igénye a matematikai nyelvészet kialakulásához és fejlődéséhez vezetett. A Szovjetunióban ebben a kérdésben a vezető szerepet a matematikusok játszották A.A. Ljapunov, O.S. Kulagina, V.A. Uszpenszkij, nyelvészek V. Yu. Rosenzweig, P.S. Kuznyecov, R.M. Frumkina, A.A. Reformatsky, I.A. Melchuk, V.V. Ivanov. Kulagina disszertációját a nyelvtan formális elméletének tanulmányozásának szentelte (N. Chomskyval egyidejűleg az USA-ban), Kuznyecov a nyelvészet axiomatizálásának problémáját vetette fel F. F. munkáira visszanyúlva. Fortunatova.

1960. május 6-án elfogadták a Szovjetunió Tudományos Akadémia Elnökségének határozatát „A nyelvkutatás strukturális és matematikai módszereinek kidolgozásáról”, és megfelelő részlegeket hoztak létre a Nyelvtudományi Intézetben és az Orosz Nyelvi Intézetben. 1960 óta vezeti humanitárius egyetemek országok - a Moszkvai Állami Egyetem filológiai kara, a Leninrad, a Novoszibirszki Egyetemek, a Moszkvai Állami Idegennyelvi Pedagógiai Intézet - megkezdték a személyzet képzését az automatikus szövegfeldolgozás területén.

Ugyanakkor ennek az időszaknak a „klasszikusnak” nevezett gépi fordításával kapcsolatos munka inkább elméleti, mint gyakorlati érdeklődésre tart számot. Költséghatékony gépi fordítórendszereket csak a múlt század nyolcvanas éveiben kezdtek létrehozni. Erről később, a 2.1-es, „Gépi fordítás” részben fogok beszélni.

Az 1960-as és 70-es évek mély elméleti fejlesztéseket tartalmaztak a halmazelmélet és a matematikai logika módszereivel, mint például a mezőelmélet és a fuzzy halmazok elmélete.

A nyelvtudományi terepelmélet szerzője a szovjet költő, fordító és nyelvész V.G. Admony. Elméletét kezdetben a német nyelv alapján dolgozta ki. Az Admoniban a „mező” fogalma a nyelvi elemek tetszőleges, nem üres halmazát jelöli (például „lexikális mező”, „szemantikai mező”).

A mező szerkezete heterogén: egy magból áll, melynek elemei a halmazt meghatározó jellemzők teljes halmazával rendelkeznek, és egy perifériából, amelynek elemei rendelkezhetnek egy adott halmaz jellemzőivel (nem mindegyik) és a szomszédosak. Hadd mondjak egy példát ennek az állításnak a szemléltetésére: mondjuk az angolban az összetett szavak mezőjét ("day-dream" - "dream" nehéz elválasztani a kifejezések mezőjétől ("tear gas" - "tear gas")). .

A fuzzy halmazok fentebb már említett elmélete szorosan kapcsolódik a térelmélethez. A Szovjetunióban ennek alátámasztását V.G. nyelvészek végezték. Admoni, I.P. Ivanova, G.G. Pochencov, de alapítója L. Zade amerikai matematikus volt, aki 1965-ben publikálta a „Fuzzy Logic” című cikket. Zadeh a fuzzy halmazok elméletének matematikai igazolását a nyelvi anyag felhasználásával vette figyelembe.

Ebben az elméletben nem annyira az elemek adott halmazhoz való tartozásáról (Aa) beszélünk, hanem ennek a tagságnak a mértékéről (Aa), mivel a perifériás elemek ilyen vagy olyan mértékben több területhez is tartozhatnak. Zade (Lofti-zade) Azerbajdzsánban született, 12 éves koráig négy nyelven - azerbajdzsáni, orosz, angol és perzsa - kommunikált, és három különböző ábécét használt: cirill, latin, arab. Amikor egy tudóst megkérdeznek, mi a közös a fuzzy halmazelméletben és a nyelvészetben, nem tagadja ezt az összefüggést, de pontosítja: „Nem vagyok benne biztos, hogy ezeknek a nyelveknek a tanulmányozása nagy hatással volt a gondolkodásomra. Ha ez megtörtént, az talán tudat alatt történt.” Fiatalkorában Zadeh Teheránban tanult egy presbiteriánus iskolában, majd a második világháború után az Egyesült Államokba emigrált. „Nem az a kérdés, hogy amerikai, orosz, azerbajdzsáni vagyok-e vagy valaki más” – mondta az egyik beszélgetésben – „Engem ezek a kultúrák és népek formálnak, és mindegyik között jól érzem magam.” Ezekben a szavakban van valami hasonló ahhoz, ami a fuzzy halmazok elméletét jellemzi – az egyértelmű definícióktól és éles kategóriáktól való eltérés.

Hazánkban a 70-es években a 20. század nyugati nyelvészeinek munkáit fordították és tanulmányozták. I.A. Melchuk lefordította N. Chomsky műveit oroszra. ON A. Slyusareva „F. de Saussure elmélete a modern nyelvészet tükrében” című könyvében összekapcsolja Saussure tanításának posztulátumait a 70-es évek aktuális nyelvészeti problémáival. A nyelvészet további matematizálása felé mutató tendencia látszik. A vezető hazai egyetemek „Matematikai (elméleti, alkalmazott) nyelvészet” szakon nyújtanak képzést. Nyugaton ugyanakkor éles ugrás tapasztalható a számítástechnika fejlődésében, ami egyre újabb nyelvi alapokat igényel.

Az 1980-as években a Tudományos Akadémia Keletkutatási Intézetének professzora Yu.K. Lekomcev, aki a nyelvészet nyelvét diagramok, táblázatok és a nyelvi leírásokban használt egyéb jelölések elemzésén keresztül elemzi, a matematikai rendszereket (főleg mátrixalgebrai rendszereket) tartja alkalmasnak erre a célra.

Így a huszadik század során az egzakt tudományok és a bölcsészettudományok közeledése volt megfigyelhető. A matematika és a nyelvészet kölcsönhatása egyre gyakrabban talált gyakorlati alkalmazásra. Erről bővebben a következő fejezetben.

2. fejezet Válogatott példák a matematika nyelvtudományi felhasználására

2.1 Gépi fordítás

Az egyik nyelvről a másikra univerzális mechanizmus segítségével történő fordítás gondolata több évszázaddal korábban merült fel, mint ahogy az első fejlesztések elkezdődtek ezen a területen – még 1649-ben Rene Descartes felvetette egy olyan nyelv ötletét, amelyben a különböző nyelvek egyenértékű gondolatai. egyetlen szimbólummal lenne kifejezve. Ennek az elképzelésnek az első megvalósítási kísérletei az 1930-as-40-es években, az elméleti fejlesztések kezdete a század közepén, a fordítási rendszerek technológia felhasználásával történő fejlesztése az 1970-es-80-as években, a fordítási technológia rohamos fejlődése az elmúlt évtizedben - ezek a gépi fordítás, mint iparág fejlődésének állomásai. A számítógépes nyelvészet tudományként a gépi fordítással kapcsolatos munkának köszönhető.

A számítástechnika fejlődésével a 70-es évek végén és a 80-as évek elején a kutatók reálisabb és költséghatékonyabb célokat tűztek ki maguk elé – a gép nem versenytársa lett (ahogy korábban feltételezték), hanem egy emberi fordító asszisztense. A gépi fordítás megszűnik kizárólag katonai célokat szolgálni (valamennyi szovjet és amerikai találmány és kutatás, amely elsősorban az orosz és az angol nyelvre irányult, valamilyen mértékben hozzájárult a hidegháborúhoz). 1978-ban a természetes nyelvű szavakat az Arpa hálózaton keresztül továbbították, hat évvel később pedig az Egyesült Államokban megjelentek az első fordítóprogramok mikroszámítógépekhez.

A 70-es években az Európai Közösségek Bizottsága megvásárolja a Systran számítógépes fordító angol-francia változatát, megrendelve a francia-angol és az olasz-angol verziókat, valamint az amerikaiak által használt orosz-angol fordítórendszert. Fegyveres erők. Így rakták le az EUROTRA projekt alapjait.

A gépi fordítás újjáéledéséről a 70-80-as években. tanúskodni a következő tényeket: Az Európai Közösségek Bizottsága (CEC) megvásárolja a Systran angol-francia változatát, valamint egy orosz-angol fordítórendszert (ez utóbbit az ALPAC jelentés után fejlesztették ki, és továbbra is az amerikai légierő és a NASA használja); emellett a CEC megbízza a francia-angol és az olasz-angol verziók fejlesztését. Ugyanakkor Japánban gyorsan bővül a gépi fordítórendszerek létrehozására irányuló tevékenység; az USA-ban a Pánamerikai Egészségügyi Szervezet (PAHO) spanyol-angol irányvonal (SPANAM rendszer) kidolgozását rendeli el; Az Egyesült Államok légiereje az austini Texasi Egyetem Nyelvészeti Kutatóközpontjában finanszírozza a gépi fordítórendszer fejlesztését; A kanadai TAUM csoport jelentős előrelépést tesz a METEO (időjárás-jelentések fordítására) rendszerének fejlesztésében. Számos projekt indult a 70-80-as években. később teljes értékű kereskedelmi rendszerré fejlődött.

Az 1978-93 közötti időszakban az Egyesült Államok 20 millió dollárt költött a gépi fordítás területén végzett kutatásra, 70 milliót Európában és 200 milliót Japánban.

Az egyik új fejlesztés a TM (translation memory) technológia, amely az akkumuláció elvén működik: a fordítási folyamat során az eredeti szegmens (mondat) és annak fordítása mentésre kerül, aminek eredményeként egy nyelvi adatbázis jön létre; Ha az újonnan lefordított szövegben az eredetivel azonos vagy ahhoz hasonló szegmens található, az a fordítással és a százalékos egyezés jelzésével együtt jelenik meg. A fordító ezután döntést hoz (szerkeszti, elutasítja vagy elfogadja a fordítást), melynek eredményét a rendszer eltárolja, így nem kell kétszer lefordítani ugyanazt a mondatot. Jelenleg egy jól ismert, TM technológián alapuló kereskedelmi rendszer fejlesztője az 1984-ben alapított TRADOS rendszer.

Jelenleg több tucat vállalat fejleszt kereskedelmi gépi fordítórendszereket, köztük: Systran, IBM, L&H (Lernout & Hauspie), Transparent Language, Cross Language, Trident Software, Atril, Trados, Caterpillar Co., LingoWare; Ata szoftver; Lingvistica b.v. stb. Mostantól az automatikus fordítók szolgáltatásait közvetlenül a weben is igénybe veheti: alphaWorks; A PROMT online fordítója; LogoMedia.net; AltaVista Babel Fish fordítószolgálata; InfiniT.com; Az internet fordítása.

A kereskedelmileg hatékony fordítórendszerek a 80-as évek második felében jelentek meg hazánkban. Maga a gépi fordítás fogalma is kibővült (kezdett magában foglalni „számos automatikus és automatizált rendszer és eszköz létrehozását, amelyek automatikusan vagy félautomatikusan hajtják végre a teljes fordítási ciklust vagy az egyes feladatokat egy személlyel párbeszédben”), ill. az ágazat fejlesztésére szánt állami források növekedtek.

A hazai fordítórendszerek fő nyelvei az orosz, angol, német, francia és japán. Az All-Union Translation Center (VTsP) egy EC-1035-ANRPP számítógépen angol és német nyelvről oroszra fordítási rendszert fejlesztett ki. Három szótárból állt - angol és német beviteli és orosz kimeneti - egyetlen szoftver alatt. Számos cserélhető szakszótár volt - számítástechnika, programozás, rádióelektronika, gépészet, mezőgazdaság, kohászat témakörben. A rendszer két üzemmódban működhetett - automatikus és interaktív, amikor a képernyőn a forrásszöveg és a fordítás látható volt, kifejezésenként, amelyet egy személy szerkeszthet. A szöveg ANRAP-ba történő fordításának sebessége (a gépelés kezdetétől a nyomtatás végéig) körülbelül 100 oldal volt óránként.

1989-ben létrehoztak egy kereskedelmi fordítói családot, mint például a SPRINT, akik orosz, angol, német és japán nyelven dolgoztak. Legfőbb előnyük az IBM PC-vel való kompatibilitás volt – így a hazai gépi fordítórendszerek nemzetközi minőségi szintet értek el. Ezzel párhuzamosan egy gépi fordítási rendszert fejlesztenek franciáról oroszra FRAP, amely a szövegelemzés 4 szakaszát tartalmazza: grafematikai, morfológiai, szintaktikai és szemantikai. A Leningrádi Állami Pedagógiai Intézetben nevezték el. Herzen egy négynyelvű (angol, francia, spanyol, orosz) SILOD-MP rendszeren dolgozott (ipari módban az angol-orosz és a francia-orosz szótárakat használták).

Az elektrotechnikai szövegek speciális fordítására az ETAP-2 rendszer volt. A benne lévő bemeneti szöveg elemzését két szinten - morfológiai és szintaktikai - végezték. Az ETAP-2 szótár mintegy 4 ezer szócikket tartalmazott; szövegátalakítási szakasz - körülbelül 1000 szabály (96 általános, 342 privát, a többi szótár). Mindez kielégítő fordítási minőséget biztosított (például a szabadalom címét „Optikai fázisrács elrendezés és ilyen elrendezésű csatolóeszköz” „Optikai fázisrács elrendezés és ilyen eszközhöz csatlakoztató eszköz”-nek fordították – a tautológia ellenére a jelentése megmaradt).

A Minszki Idegen Nyelvek Pedagógiai Intézetében a címek gépi fordításának rendszerét találták ki egy angol-orosz szóalak- és kifejezésszótár alapján, a Tudományos Akadémia Keletkutatási Intézetében pedig egy fordítórendszert. japánból oroszra találták ki. A Moszkvai Automatizálási Rendszerek Kutatóintézetében létrehozott első számítógépes technológiai és programozási automatikus szótár- és terminológiai szolgáltatás (SLOTERM) hozzávetőleg 20 000 kifejezést tartalmazott a magyarázó szótárban és a nyelvészeti kutatások speciális szótáraiban.

A gépi fordítórendszereket fokozatosan kezdték használni nemcsak rendeltetésüknek megfelelően, hanem az automatikus tanulási rendszerek fontos elemeként is (fordítás tanítására, helyesírási és nyelvtani ismeretek figyelésére).

A 90-es évek magukkal hozták a PC-piac (az asztali gépektől a zsebméretűekig) és az információtechnológia rohamos fejlődését, valamint az internet széles körű elterjedését (amely egyre inkább nemzetközivé és többnyelvűvé válik). Mindez igényessé tette az automatizált fordítórendszerek továbbfejlesztését. Az 1990-es évek eleje óta. A hazai fejlesztők is belépnek a PC-rendszerek piacára.

1990 júliusában a moszkvai PC Forum kiállításon bemutatták Oroszország első kereskedelmi gépi fordítórendszerét, a PROMT-et (PROgrammer's Machine Translation). 2014-ben ezt a formát a nem nyilvános részvénytársaság] „PROMT” váltotta fel, és már 1992-ben a PROMT cég nyerte meg a NASA MP rendszerek szállítására kiírt versenyét (a PROMT volt az egyetlen nem amerikai cég ebben a versenyben. 1992-ben a "PROMT" rendszerek egész családját állítja elő új STYLUS néven angol, német, francia, olasz és spanyol nyelvről oroszra és oroszról angolra való fordításhoz, 1993-ban pedig a világ első gépi fordítórendszerét Windowshoz. A STYLUS verzió alapján készült a STYLUS 2.0 Windows 3.X/95/NT-re, és 1995-1996-ban megjelent a gépi fordítórendszerek harmadik generációja, a teljesen 32 bites STYLUS 3.0 Windows 95/NT-hez. , egyúttal teljesen új, elsőként az orosz-német és az orosz-francia gépi fordítórendszerek világában.

1997-ben megállapodást írtak alá a francia Softissimo céggel, hogy fordítórendszereket hozzanak létre franciáról németre és angolra és fordítva, és ez év decemberében megjelent a világ első német-francia fordítórendszere. Ugyanebben az évben a PROMT cég kiadott egy Gigant technológiával megvalósított rendszert, amely egy shellben több nyelvi irányt támogat, valamint egy speciális fordítót az internetes munkához, a WebTranSite-ot.

1998-ban programok egész konstellációja jelent meg új PROMT 98 néven. Egy évvel később a PROMT cég két új terméket adott ki: egy egyedi szoftvercsomagot az interneten való munkához - PROMT Internet, valamint egy fordítót a vállalati levelezőrendszerekhez - PROMT Mail Translator. 1999 novemberében a PROMT-t a francia PC Expert magazin által tesztelt legjobb gépi fordítórendszernek ismerte el, 30 százalékkal megelőzve versenytársait az összesített mutatók tekintetében. Vállalati ügyfelek számára speciális szervermegoldásokat is fejlesztettek - a PROMT Translation Server (PTS) vállalati fordítószervert és a PROMT Internet Translation Server (PITS) internetes megoldást. 2000-ben a PROMT frissítette teljes szoftvertermékét, kiadva az MP rendszerek új generációját: PROMT Translation Office 2000, PROMT Internet 2000 és Magic Gooddy 2000.

A PROMT rendszer támogatásával végzett online fordítást számos hazai és külföldi oldalon használják: PROMT's Online Translator, InfiniT.com, Translate.Ru, Lycos stb., valamint különféle profilú üzleti fordító intézményekben. dokumentációt, cikkeket és leveleket (az Outlook Expressbe és más e-mail kliensekbe közvetlenül beépített fordítórendszerek vannak).

Napjainkban új, rendszerhasználaton alapuló gépi fordítási technológiák jelennek meg mesterséges intelligencia, statisztikai módszerek. Ez utóbbiakról a következő részben lesz szó.

2.2 Statisztikustudományos módszerek a nyelvtanulásban

A modern nyelvészetben jelentős figyelmet fordítanak a nyelvi jelenségek kvantitatív matematikai módszerekkel történő vizsgálatára. A kvantitatív adatok gyakran segítenek mélyebben megérteni a vizsgált jelenségeket, helyüket, szerepüket a kapcsolódó jelenségek rendszerében. A „mennyit” kérdésre adott válasz segít megválaszolni a „mit”, „hogyan”, „miért” kérdéseket - ez a mennyiségi jellemzők heurisztikus lehetősége.

A statisztikai módszerek jelentős szerepet játszanak a gépi fordítórendszerek fejlesztésében (lásd 2.1. fejezet). A statisztikai megközelítésben a fordítási problémát egy zajos csatorna szempontjából vizsgáljuk. Képzeljük el, hogy le kell fordítanunk egy mondatot angolról oroszra. A zajcsatorna-elv a következő magyarázatot kínálja számunkra egy angol és egy orosz kifejezés kapcsolatára: az angol mondat nem más, mint valami zaj által eltorzított orosz mondat. Az eredeti orosz mondat rekonstruálásához tudnunk kell, hogy az emberek pontosan mit mondanak általában oroszul, és hogyan torzulnak az orosz kifejezések angolra. A fordítás úgy történik, hogy olyan orosz mondatot keresünk, amely maximalizálja az orosz mondat feltétlen valószínűségének és az angol mondat (eredeti) valószínűségének szorzatát az adott orosz mondatban. Bayes tétele szerint ez az orosz mondat a legvalószínűbb angol fordítás:

ahol e a fordítási mondat és f az eredeti mondat

Tehát szükségünk van egy forrásmodellre és egy csatornamodellre, vagy egy nyelvi modellre és egy fordítási modellre. A nyelvi modellnek a célnyelv (esetünkben az orosz) bármely mondatához valószínűségi pontszámot kell rendelni, a fordítási modell pedig az eredeti mondathoz. (lásd 1. táblázat)

A gépi fordítórendszer általában két módban működik:

1. A rendszer betanítása: párhuzamos szövegek tanító korpuszát veszünk, és lineáris programozással megkeresik a fordítási megfelelési táblák értékeit, amelyek maximalizálják (például) a korpusz orosz részének valószínűségét a meglévő angol nyelv mellett. rész a kiválasztott fordítási modell szerint. Ugyanennek a korpusznak az orosz részére épül fel az orosz nyelv modellje.

2. Művelet: a kapott adatok alapján egy orosz mondatban egy ismeretlen angol mondatot keresünk, amely maximalizálja a nyelvi modell és a fordítási modell által hozzárendelt valószínűségek szorzatát. A kereséshez használt programot decryptornak nevezik.

A legegyszerűbb statisztikai fordítási modell a szó szerinti fordítási modell. Ebben a modellben azt feltételezzük, hogy egy mondat egyik nyelvről a másikra való lefordításához elegendő az összes szót lefordítani (egy „szózsákot” létrehozni), és a megfelelő sorrendbe rendezésüket a modell biztosítja. P(a, f | e) redukálása P(a | e , f-re), azaz. adott igazítás valószínűsége egy adott mondatpárra, minden P(a, f | e) valószínűséget normalizálunk egy adott mondatpár összes igazításának valószínűségeinek összegével:

Az 1. modell betanításához használt Viterbi algoritmus megvalósítása a következő:

1. A fordítási megfelelési valószínűségek teljes táblázata ugyanazokkal az értékekkel van kitöltve.

2. A szavak páronkénti összekapcsolásának minden lehetséges változatára kiszámítjuk a P(a, f | e) valószínűséget:

3. A P(a, f | e) értékeket normalizáljuk, hogy megkapjuk a P(a | e, f) értékeket.

4. A rendszer kiszámítja az egyes átviteli párok gyakoriságát, súlyozva az egyes igazítási opciók valószínűségével.

5. Az eredményül kapott súlyozott gyakoriságokat normalizáljuk, és egy új fordítási megfelelési valószínűségi táblázatot hozunk létre.

6. Az algoritmus megismétlődik a 2. lépéstől.

Példaként tekintsük egy hasonló modell képzését két mondatpárból álló korpuszon (2. ábra):

Fehér Ház

Nagyszámú iteráció után kapunk egy táblázatot (2. táblázat), amelyből látható, hogy a fordítás nagy pontossággal történik.

Ezenkívül a statisztikai módszereket széles körben használják a szókincs, a morfológia, a szintaxis és a stilisztika tanulmányozásában. A Permi Állami Egyetem tudósai tanulmányt végeztek azon az állításon alapulva, hogy a sztereotip szóösszetételek a szöveg fontos „építőanyagai”. Ezek a kifejezések „mag” ismétlődő szavakból és függő konkretizáló szavakból állnak, és kifejezett stilisztikai színezetűek.

Tudományos stílusban a „nukleáris” szavakat nevezhetjük: kutatás, tanulmány, feladat, probléma, kérdés, jelenség, tény, megfigyelés, elemzés stb. Az újságírásban a „nukleáris” szavak olyan szavak lesznek, amelyek kifejezetten az újság szövegében megnövekedett értékkel bírnak: idő, személy, hatalom, anyag, cselekvés, törvény, élet, történelem, hely stb. (összesen 29)

A nyelvészek számára különösen érdekes a nemzeti nyelv szakmai differenciálása, valamint a foglalkozás típusától függő egyedi szókincs- és nyelvhasználat. Ismeretes, hogy a járművezetők az sh formát használják a szakmai beszédben O fer, az orvosok beszélnek O Clush Cockle helyett Yu w - hasonló példák hozhatók. A statisztika feladata a kiejtés változékonyságának és a nyelvi norma változásának figyelemmel kísérése.

A szakmai különbségek nemcsak nyelvtani, hanem lexikai különbségekhez is vezetnek. A róla elnevezett Jakut Állami Egyetemen. M.K. Ammosov 50 kérdőívet elemzett, amelyekben az orvosok és építők között a leggyakoribb reakciók voltak bizonyos szavakra (3. táblázat).

Építők

Emberi

beteg (10), személyiség (5)

férfi (5)

segítség (8), segítség (7)

gonosz (16)

élet

halál (10)

gyönyörű (5)

halál

holttest (8)

élet (6)

Tűz

hő (8), égés (6)

tűz (7)

ujj

kéz (14), bűnöző (5)

hüvelykujj (7), index (6)

szemek

látás (6), tanuló, szemész (5-5)

barna (10), nagy (6)

fej

elme (14), agy (5)

nagy (9), okos (8), okos (6)

elveszít

tudat, élet (4 darab)

pénz (5), talál (4)

Megállapítható, hogy az orvosok gyakrabban adnak szakmai tevékenységükhöz kapcsolódó egyesületeket, mint az építőmesterek, hiszen a kérdőívben szereplő ösztönző szavak inkább a szakmájukhoz, mint az építői szakmához kapcsolódnak.

A nyelv statisztikai mintáit gyakorisági szótárak készítésére használják – olyan szótárak, amelyek bármely nyelv szavainak (szóalakok, kifejezések) gyakoriságának numerikus jellemzőit adják meg – egy író, egy mű stb. nyelvét. szót a gyakoriság jellemzőjeként használják egy bizonyos hosszúságú szövegben

A beszédészlelés modellje lehetetlen szótár nélkül, mint annak leglényegesebb alkotóeleme. A beszéd észlelésekor a fő műveleti egység a szó. Ebből különösen az következik, hogy az észlelt szöveg minden szavát azonosítani kell a hallgató (vagy olvasó) belső szókincsének megfelelő egységével. Természetes azt feltételezni, hogy a keresés kezdettől fogva a szótár bizonyos részterületeire korlátozódik. A legtöbb modern beszédészlelési elmélet szerint a hangzó szöveg tényleges fonetikai elemzése tipikus esetben csak részben ad információt a szó lehetséges fonológiai megjelenéséről, és erre nem egy, hanem egy bizonyos válasz ad választ. SOK szó a szótárban; Ezért két probléma merül fel:

(a) válassza ki a megfelelő készletet bizonyos paraméterek szerint;

(b) a körülhatárolt halmazon belül (ha megfelelően van kiválasztva) „ki kell szűrni” az összes szót, kivéve azt, amelyik a legjobban megfelel a felismert szöveg adott szavának. Az egyik szűrési stratégia az alacsony gyakoriságú szavak kiiktatása. Ebből következik, hogy a beszédészlelés szótára egy frekvenciaszótár. A bemutatott projekt kezdeti feladata az orosz nyelvű frekvenciaszótár számítógépes változatának elkészítése.

5 gyakorisági szótár létezik az orosz nyelven (nem számítva az ipari szótárakat). A meglévő szótárak néhány általános hiányosságára figyeljünk fel.

Az orosz nyelv összes ismert gyakorisági szótára az írott (nyomtatott) szövegek tömbjeinek feldolgozására épül. Részben ezért, amikor egy szó azonossága nagyrészt formai, grafikus egybeeséseken alapul, a szemantikát nem veszik kellőképpen figyelembe. Ennek eredményeként a frekvencia jellemzői eltolódnak és torzulnak; ha például egy gyakorisági szótár összeállítója a „barát” szóhasználat általános statisztikájában az „egymás” összetételből származó szavakat is beveszi, akkor ez aligha indokolt: a szemantikát figyelembe véve el kell ismernünk, hogy ezek már különböző szavak, vagy inkább azt, hogy önálló szókincs egységet képeznek, csak maga a kombináció egésze.

Ezenkívül minden létező szótárban a szavak csak alapformájukban vannak elhelyezve: a főnevek egyes számban, névelős esetek, az igék infinitív alakban stb. A szótárak egy része tájékoztatást ad a szóalakok gyakoriságáról, de ezt általában nem kellően következetesen és nem kimerítően teszik. Ugyanannak a szónak a különböző szóalakjainak gyakorisága nyilvánvalóan nem esik egybe. A beszédészlelési modell kidolgozójának figyelembe kell vennie, hogy egy valós észlelési folyamatban a szövegbe „merült” sajátos szóalak tartozik a felismerés alá: a szóalaki kitevő kezdeti szakaszának elemzése alapján sok azonos kezdetű szó keletkezik, és a szóalak kezdő szakasza nem feltétlenül azonos a kezdeti szakasz szótári forma. A szóalakhoz tartozik egy sajátos ritmikai szerkezet – szintén rendkívül fontos paraméter az észlelési szóválasztáshoz. Végül a felismert megnyilatkozás végső reprezentációjában a szavakat ismét a hozzájuk tartozó szóalak képviseli.

Sok olyan mű van, amely bemutatja a frekvencia fontosságát a beszédészlelés folyamatában. De nem tudunk olyan munkáról, amely a szóalakok gyakoriságát alkalmazná – éppen ellenkezőleg, gyakorlatilag minden szerző figyelmen kívül hagyja az egyes szóalakok gyakoriságát, kizárólag a lexémákhoz fordul. Ha az általuk kapott eredményeket nem tekintjük műterméknek, akkor fel kell tételeznünk, hogy az anyanyelvi beszélő valamilyen módon hozzáfér a szóalakok gyakorisága és a szótári forma kapcsolatára vonatkozó információkhoz, vagyis valójában lexémákhoz. Ráadásul ez a fajta átmenet a szóalakról a lexémára természetesen nem magyarázható természetes tudás megfelelő paradigma, mivel a frekvenciainformációt a szó végső azonosítása előtt kell használni, különben egyszerűen elveszti értelmét.

Elsődleges statisztikai jellemzők alapján, adott relatív hibával meghatározható a szókincs azon része, amely szövegtípustól függetlenül nagy előfordulási gyakoriságú szavakat tartalmaz. Az is lehetséges, hogy a szótárba lépésenkénti rendezést bevezetve olyan szótárakat kaphatunk, amelyek a gyakori szavak első 100, 1000, 5000 stb. A szótár statisztikai jellemzői a szókincs szemantikai elemzése kapcsán érdekesek. A szubjektum-ideológiai csoportok és szemantikai mezők vizsgálata azt mutatja, hogy a lexikális asszociációkat olyan szemantikai kapcsolatok támogatják, amelyek a legáltalánosabb jelentésű lexémák köré koncentrálódnak. A lexikális-szemantikai mezőn belüli jelentések leírása a legelvontabb lexémákkal rendelkező szavak azonosításával valósítható meg. Nyilvánvalóan az „üres” (a névleges potenciák szempontjából) szókincsegységek statisztikailag homogén réteget alkotnak.

Nem kevésbé értékesek az egyes műfajok szótárai. Hasonlóságuk mértékének és statisztikai eloszlások jellegének tanulmányozása érdekes információkkal szolgál a szókincs beszédhasználati szféránkénti minőségi rétegződéséről.

A nagyfrekvenciás szótárak összeállítása számítástechnikai alkalmazást igényel. A részleges gépesítés és automatizálás BEVEZETÉSE a szótári munka folyamatába a különböző szövegekhez készült szótárak gépi feldolgozásának kísérleteként érdekes. Egy ilyen szótár szigorúbb rendszert igényel a szókincsanyag feldolgozásához és felhalmozásához. Miniatűrben egy információkereső rendszer, amely a szöveg és a szókincs különböző aspektusairól képes információt szolgáltatni. A rendszer néhány alapvető lekérdezését már a kezdetektől megtervezzük: a leltárszavak teljes száma, egyetlen szó és teljes szótárak statisztikai jellemzői, a szótár gyakori és ritka területeinek rendezése stb. A gépi kartoték lehetővé teszi, hogy automatikusan fordított szótárakat készíteni az egyes műfajokhoz és forrásokhoz. A felhalmozott információtömbből sok más hasznos statisztikai információ nyerhető ki a nyelvről. A számítógépes frekvenciaszótár kísérleti alapot teremt a szótári munka kiterjedtebb automatizálására való átálláshoz.

A gyakorisági szótárak statisztikai adatai széles körben felhasználhatók más nyelvi problémák megoldásában - például a modern orosz nyelv aktív szóalkotási eszközeinek elemzésében és meghatározásában, a grafika és a helyesírás javításával kapcsolatos kérdések megoldásában, amelyek a statisztikai adatok figyelembevételével járnak. információk a szókincs összetételéről (mindeznél fontos figyelembe venni a grafémakombinációk valószínűségi jellemzőit, a szavakban megvalósított betűkombinációk típusait), a gyakorlati átírást és átírást. A szótár statisztikai paraméterei hasznosak lesznek a nyomtatás automatizálásával, az alfabetikus szövegek felismerésével és automatikus olvasásával kapcsolatos problémák megoldásában is.

Az orosz nyelv modern magyarázó szótárai és nyelvtanai főként irodalmi és művészeti szövegek alapján épülnek fel. Vannak az A.S. nyelv gyakorisági szótárai. Puskina, A.S. Griboedova, F.M. Dosztojevszkij, V.V. Viszockij és sok más szerző. A Szmolenszki Állami Egyetem Irodalomtörténeti és Irodalomelméleti Tanszékén. A Pedagógiai Egyetem évek óta dolgozik a költői és prózai szövegek gyakorisági szótárainak összeállításán. Ehhez a tanulmányhoz Puskin összes dalszövegének és az aranykor két másik költőjének gyakorisági szótárát választották ki - Gribojedov „Jaj a szellemességből” és Lermontov összes költészete; Pasternak és az ezüstkor öt másik költője – Balmont 1894-1903, Blok „Versek egy gyönyörű hölgyről”, Mandelstam „Kő”, Gumiljov „Tűzoszlopa”, Ahmatova „Anno Domini MCMXXI” és „A nővére” Életem” Pasternak és további négy vaskorbeli költő - „Jurij Zsivago versei”, „Ha kitisztul”, M. Petrov teljes dalszövegei, „Az út messze van”, „Szélvédő”, „ Búcsú a hótól” és Mezsirov „Pakó”, Voznyeszenszkij „Antimirov” és „Hóasszony” » Rylenkova.

Meg kell jegyezni, hogy ezek a szótárak természetükben eltérőek: egyesek egy drámai mű szókincsét képviselik, mások egy dalszövegkönyvet vagy több könyvet, vagy egy költő teljes költészeti korpuszát. Az ebben a munkában bemutatott elemzés eredményeit óvatosan kell kezelni, nem tekinthetjük abszolútnak. Ugyanakkor speciális intézkedések segítségével bizonyos mértékig csökkenthető a szövegek ontológiai jellegének különbsége.

Az utóbbi években egyre jobban felismerhető a köznyelv és a könyvbeszéd közötti ellentét. Ez a kérdés különösen heves vitákat vált ki a módszertanosok körében, akik a tanításban a beszélt nyelv irányába történő elmozdulást követelnek. Ugyanakkor a köznyelvi beszéd sajátosságai továbbra is tisztázatlanok.

A szótári feldolgozás egy egyedi alkalmazás létrehozásával történt az EXCEL97 irodai programkörnyezetben. Az alkalmazás négy munkalapot tartalmaz az EXCEL könyvben - „Címlap”, „Szótárak” a kezdeti adatokkal, „Közelségek” és „Távolságok” eredményekkel, valamint egy sor makrót.

A kezdeti információkat a „Szótárak” lapra kell beírni. A vizsgált szövegek szótárait EXCEL cellákba írjuk, az utolsó S oszlopot a kapott eredményekből, ill. mennyiségével egyenlő más szótárakban található szavak. A Közelség és Távolság táblázat tartalmazza az M közelség, az R korreláció és a D távolság számított mértékét.

Az alkalmazásmakrók a Visual Basic for Application (VBA) programban írt eseményalapú programozási eljárások. Az eljárások VBA-könyvtárobjektumokon és azok feldolgozási módszerein alapulnak. Így az alkalmazás munkalapjával végzett műveletekhez a Worksheet key objektum és a megfelelő Lap aktiválása aktiválási módszer használatos. Az elemzett forrásadatok tartományának beállítása a „Szótárak” lapon a Range objektum Select metódusával történik, és a szavak értékként való átadása a változóknak ugyanazon Range objektum Value tulajdonságaként történik.

Annak ellenére, hogy a rangkorreláció elemzése óvatossá tesz bennünket a témák különböző szövegek közötti függőségét illetően, az egyes szövegekben a legtöbb leggyakoribb szó egy vagy több más szövegben is egyezik. Az S oszlop az egyes szerzők 15 leggyakoribb szava között mutatja az ilyen szavak számát. Azok a szavak, amelyek táblázatunkban csak egy költőnél szerepelnek, félkövérrel vannak kiemelve. Bloknak, Akhmatovának és Petrovnak egyáltalán nincs kiemelt szava, S = 15. Ennél a három költőnél a 15 leggyakoribb szó megegyezik, csak a listán elfoglalt helyükben térnek el egymástól. De még Puskinnak is, akinek a szókincse a legeredetibb, van S = 8 és 7 kiemelt szó.

Az eredmények azt mutatják, hogy a szókincsnek van egy bizonyos rétege, amely a költészet fő témáit koncentrálja. Ezek a szavak általában rövidek: az összes szóhasználatból (225) 88 egyszótagos, 127 két szótagos, 10 pedig három szótagos párok: éjszaka - nappal, föld - ég (nap), Isten - ember (nép), élet - halál, test - lélek, Róma - világ(Mandelstamtól); magasabb szintű mitológiákká kombinálható: ég, csillag, nap, föld; az emberben általában a test, a szív, a vér, a kar, a láb, az arc, a szem megkülönböztethető. Az emberi állapotok közül az alvást és a szeretetet részesítik előnyben. A ház és a városok az emberi világhoz tartoznak - Moszkva, Róma, Párizs. A kreativitást lexémák képviselik szóÉs dal.

Gribojedovnak és Lermontovnak szinte nincs a természetet jelző szava a leggyakoribb szavak között. Háromszor annyi szó van bennük, amelyek egy személyt, testrészeit, lelki világának elemeit jelölik. Puskinban és a XX. század költőiben. Az ember és a természet megnevezései megközelítőleg egyenlően oszlanak meg. A téma e fontos aspektusában elmondhatjuk, hogy a XX. követte Puskint.

Minimális téma ügy a leggyakoribb szavak között csak a Gribojedovnál és a Puskinnál található. Lermontovban és a XX. század költőiben. minimális témának ad teret szó. A szó nem zárja ki a tettet (a téma bibliai értelmezése: az Újszövetségben Jézus Krisztus egész tanítását Isten szavának vagy Jézus szavának tekintik, és az apostolok néha az Ige szolgáinak nevezik magukat). Szakrális jelentés lexémák, a szó meggyőzően nyilvánul meg például Pasternak „És a világ képmása az Igében” című versében. A lexéma szakrális jelentése szó az emberi ügyekkel együtt és ellentétben mutatkozik meg meggyőzően Gumiljov azonos című versében.

Csak egy szövegben előforduló lexémák jellemzik egy adott könyv vagy könyvgyűjtemény egyediségét. Például Gribojedov „Jaj a szellemességből” című vígjátékában az „elme” szó a leggyakoribb, de más szövegekben nem található meg a leggyakoribb szavak között. Az elme témája messze a legjelentősebb a vígjátékban. Ez a lexéma Chatsky képét kíséri, és Chatsky neve a leggyakoribb a vígjátékban. Így a mű szervesen ötvözi a leggyakoribb köznevet a leggyakoribb tulajdonnévvel.

A legmagasabb korrelációs együttható Gumilev „A tűzoszlop” és Ahmatova „Anno Domini MCMXXI” című tragikus könyveinek témáit köti össze. A 15 leggyakoribb főnév közül 10 gyakori, köztük vér, szív, lélek, szerelem, szó, ég. Emlékezzünk vissza, hogy Ahmatova könyve tartalmazza a „Soha nem fogsz élni…” miniatűrt, amely Gumiljov letartóztatása és kivégzése között íródott.

A gyertyák és a tömegek témái a vizsgált anyagban csak a „Jurij Zsivago verseiben” találhatók. A gyertya témája a regény verseiben számos kontextuális jelentéssel bír: Jézus Krisztus képéhez, a hit, a halhatatlanság, a kreativitás és a szerelmi randevú témáihoz kapcsolódik. A gyertya a legfontosabb fényforrás a regény központi jeleneteiben. A tömeg témája a regény fő gondolatával összefüggésben fejlődik ki, amelyben az ember megingathatatlan értékrendű magánélete szembehelyezkedik az új állam erkölcstelenségével, amely a tömeg tetszésének elveire épül. .

A munka magában foglal egy harmadik szakaszt, amely szintén tükröződik a programban - ez a két szótárban előforduló szavak sorszámának különbségének és két szótár azonos szavai közötti átlagos távolság kiszámítása. Ez a szakasz lehetővé teszi számunkra, hogy a szótárak interakciójának általános, statisztika segítségével azonosított trendjeitől a szöveghez közelítő szintre lépjünk. Például Gumiljov és Akhmatova könyvei statisztikailag szignifikánsan korrelálnak egymással. Megnézzük, mely szavak bizonyulnak közösnek a szótáraikban, és mindenekelőtt kiválasztjuk azokat, amelyek sorszáma közötti különbség minimális vagy nulla. Ezeknek a szavaknak ugyanaz a rangszáma, ezért ezek a minimális témák egyformán fontosak a két költő fejében. Ezután lépjen a szövegek és kontextusok szintjére.

A kvantitatív módszerek is segítik az anyanyelvi beszélők jellemzőinek tanulmányozását. Tegyük fel, hogy az orosz nyelvben 6 eset van, az angolban nincs eset, és a dagesztáni népek egyes nyelvein az esetek száma eléri a 40-et. L. Perlovsky a „Tudatosság, nyelv és kultúra” című cikkében korrelálja ezeket a jellemzőket a népek individualizmusra vagy kollektivizmusra való hajlamával, a dolgok és jelenségek külön-külön vagy másokkal összefüggésben történő észlelésével. Végül is az angol nyelvű világban (nincs eset - egy dolgot „önmagában” érzékelnek) jelentek meg olyan fogalmak, mint a személyes szabadság, a liberalizmus és a demokrácia (megjegyzendő, hogy ezeket a fogalmakat csak a nyelvvel kapcsolatban használom, értékelési jellemzők nélkül). Annak ellenére, hogy az ilyen találgatások továbbra is csak a merész tudományos hipotézisek szintjén maradnak, segítenek az ismerős jelenségek újszerű megközelítésében.

Mint látjuk, a kvantitatív jellemzők a nyelvészet egészen más területein alkalmazhatók, ami egyre inkább elmossa a határokat „egakt” és „humanitárius” módszerek között. A nyelvészet egyre gyakrabban veszi igénybe nemcsak a matematika, hanem a számítástechnika segítségét is problémái megoldásához.

2.3 Tanulás Inyelv formális logikai módszerekkel

A modern elméleti nyelvészet a matematika nem kvantitatív módszereivel, különösen a logikával kölcsönhatásba lép, nem kevésbé gyümölcsözően, mint a kvantitatív módszerekkel. A számítástechnika rohamos fejlődése és a modern világban betöltött szerepének növekedése megkívánta a nyelv és a logika kölcsönhatásának egészére vonatkozó megközelítés felülvizsgálatát.

A logikai módszereket széles körben alkalmazzák formalizált nyelvek, különösen programozási nyelvek fejlesztésében, amelyek elemei bizonyos szimbólumok (a matematikaiakkal rokon), kiválasztott (vagy korábban kiválasztott szimbólumokból összeállított) és meghatározott módon értelmezett szimbólumok. nincs „hagyományos” használata, megértése és ugyanazon szimbólumok funkciói más összefüggésekben. A programozó munkája során folyamatosan foglalkozik a logikával. A programozás lényege pontosan az, hogy megtanítsa a számítógépet észhez térni (a szó tág értelmében). Ugyanakkor az „okoskodás” módszerei nagyon eltérőek. Minden programozó bizonyos időt tölt azzal, hogy hibákat keressen saját és mások programjaiban. Vagyis az érvelésben, a logikában hibákat keresni. És ez is nyomot hagy. A logikai hibákat sokkal könnyebb észlelni a hétköznapi beszédben. A logikusok által tanulmányozott nyelvek viszonylagos egyszerűsége lehetővé teszi számukra, hogy világosabban megvilágítsák ezeknek a nyelveknek a szerkezetét, mint azt a kizárólag összetett természetes nyelveket elemző nyelvészek képesek lennének. Mivel a logikusok által vizsgált nyelvek a természetes nyelvekből másolt relációkat használnak, a logikusok jelentősen hozzájárulhatnak az általános nyelvelmélethez. Itt is hasonló a helyzet, mint a fizikában: a fizikus olyan ideálisan leegyszerűsített esetekre is megfogalmaz tételeket, amelyek a természetben egyáltalán nem fordulnak elő - törvényeket fogalmaz meg ideális gázokra, ideális folyadékokra, beszél a súrlódás nélküli mozgásról stb. . Ezekre az idealizált esetekre egyszerű törvényszerűségeket lehet megállapítani, amelyek nagymértékben hozzájárulnának annak megértéséhez, hogy mi történik a valóságban, és mi az, ami valószínűleg ismeretlen maradna a fizika számára, ha megpróbálná a valóságot közvetlenül, annak teljes összetettségében szemlélni.

A természetes nyelvek tanulmányozása során logikai módszereket alkalmaznak, hogy a nyelvtanulók ne tudjanak ostobán „megjegyezni” a lehető legtöbb szót, hanem jobban megértsék annak szerkezetét. L. Shcherba az orosz nyelv törvényei szerint felépített mondat példáját is felhasználta előadásaiban: „A glokaja kuzdra shteko budlanul bokra és kurdyachit bokrenka”, majd megkérdezte a hallgatókat, hogy ez mit jelent. Annak ellenére, hogy a mondatban szereplő szavak jelentése tisztázatlan maradt (egyszerűen nem léteznek az orosz nyelvben), egyértelműen meg lehetett válaszolni: „kuzdra” - alany, főnév női, egyes számban, névelőben, „bokr” - animál stb. A kifejezés fordítása hozzávetőlegesen a következő: „Valami nőies egy mozdulattal tett valamit egy férfi nemi lénnyel, majd elkezdett valami hosszú távú, fokozatos tevékenységet a kölykével.” Hasonló példa a nem létező szavakból készült szövegre (fikcióra), amely teljesen a nyelv törvényei szerint épül fel, Lewis Carroll „Jabberwocky”-ja (az „Alice Csodaországban” című filmben Carroll Humpty Dumpty karakterének száján keresztül magyarázza a az általa kitalált szavak jelentése: "főtt" - este nyolc óra, amikor eljön a vacsorafőzés ideje, "khliky" - gyenge és ügyes, "shoryok" - görény, borz és dugóhúzó keresztezése, "ásni" - ugrás, merülés, pörgés, "nava" - fű a napóra alatt (kicsit jobbra nyúlik, egy kicsit balra és egy kicsit hátra), "morog" - morog és nevetés, "zelyuk" - a zöld pulyka, „myumzik” - tollai kócosak és minden irányban kilógnak, mint egy seprű, „mova” - távol az otthontól) .

A modern logika és elméleti nyelvészet egyik alapfogalma, amelyet a különféle logikai-matematikai számítások nyelveinek, természetes nyelveknek a tanulmányozásában használnak a különböző „szintű” nyelvek közötti kapcsolatok leírására és a nyelvek közötti kapcsolatok jellemzésére. a vizsgált nyelvek és a segítségükkel leírtak tantárgyak- a metanyelv fogalma. A metanyelv egy másik nyelvről, egy tárgynyelvről alkotott ítéletek kifejezésére használt nyelv. A metanyelv segítségével tanulmányozzák egy tárgynyelv jelkombinációinak (kifejezéseinek) szerkezetét, tételeket bizonyítanak kifejező tulajdonságairól, más nyelvekhez való viszonyáról stb. ezt a metanyelvet. Mind a tárgynyelv, mind a metanyelv lehet közönséges (természetes) nyelv. Egy metanyelv eltérhet az objektumnyelvtől (például egy oroszoknak szóló angol tankönyvben az orosz metanyelv, az angol pedig tárgynyelv), de egybeeshet vele, vagy csak részben térhet el, például speciális terminológiában ( Az orosz nyelvi terminológia a metanyelv eleme az orosz nyelv leírására, az úgynevezett szemantikai tényezők – a természetes nyelvek szemantikáját leíró metanyelv része.

A „metanyelv” fogalma nagyon gyümölcsözővé vált a matematikai logika keretein belül felépített formalizált nyelvek tanulmányozása kapcsán. A formalizált tantárgyi nyelvektől eltérően ebben az esetben a metanyelv, amelynek segítségével a metaelmélet megfogalmazódik (a tárgynyelven megfogalmazott alanyelmélet tulajdonságait vizsgálva), általában egy közönséges természetes nyelv, a metaelmélet valamilyen speciálisan korlátozott töredéke. természetes nyelv, amely nem tartalmaz semmiféle kétértelműséget, metaforákat, „metafizikai” fogalmakat stb. a hétköznapi nyelv olyan elemeit, amelyek megakadályozzák annak használatát a pontos tudományos kutatás eszközeként. Ebben az esetben maga a metanyelv formalizálható, és (ettől függetlenül) a metametanyelv segítségével végzett kutatások tárgyává válhat, és a végtelenségig „gondolható” egy ilyen sorozat növekedése.

A logika megtanít bennünket a tárgynyelv és a metanyelv gyümölcsöző megkülönböztetésére. A nyelv-objektum a logikai kutatás tárgya, a metanyelv pedig az elkerülhetetlenül mesterséges nyelv, amelyen az ilyen kutatásokat folytatják. A logikai gondolkodás éppen abban áll, hogy a szimbólumok nyelvén (metanyelven) megfogalmazzuk egy valódi nyelv (nyelv-objektum) kapcsolatait és szerkezetét.

Egy metanyelv semmi esetre sem lehet „nem szegényebb” nála tantárgyi nyelv(azaz az utóbbi metanyelvi minden kifejezéséhez hozzá kell tartoznia a nevének - „fordítás”) - egyébként, ha ezek a követelmények nem teljesülnek (ami nyilvánvalóan előfordul a természetes nyelvekben, hacsak külön megállapodások másként nem rendelkeznek), szemantikai paradoxonok (antinómiák) ) felmerülhet.

Ahogy egyre több új programozási nyelv jön létre, a programfordítók problémája kapcsán sürgető igény merült fel a metanyelvek létrehozására. Jelenleg a leggyakrabban használt programozási nyelvek szintaxisának leírására a Backus-Naur metanyelv (rövidítve BNF). Kompakt formában jelenik meg néhány, a matematikai képletekhez hasonló képlet formájában. A nyelv minden fogalmához egyetlen metaforaképlet (normál formula) tartozik. Bal és jobb oldali részekből áll. A bal oldal a definiálandó fogalmat jelöli, a jobb pedig az elfogadható nyelvi konstrukciók halmazát adja meg, amelyek ebbe a fogalomba kapcsolódnak. A képlet speciális metaszimbólumokat használ szögletes zárójelek formájában, amelyek a definiált fogalmat (a képlet bal oldalán) vagy egy korábban definiált fogalmat (jobb oldalon) tartalmaznak, a bal és jobb oldali rész elkülönítését pedig a a "::=" metaszimbólum, amelynek jelentése megegyezik a "definíció szerint létezik" szavakkal. A metalingusztikai formulák valamilyen formában a fordítókba ágyazódnak; segítségükkel ellenőrzik, hogy a programozó által használt konstrukciók formálisan megfelelnek-e bármely ezen a nyelven szintaktikailag elfogadható konstrukciónak. Különféle tudományok külön metanyelvei is vannak - így a tudás különféle metanyelvek formájában létezik.

Logikai módszerek szolgáltak alapul a konnekcionizmus koncepcióján alapuló mesterséges intelligencia rendszerek létrehozásához is. A konnekcionizmus a filozófiai tudomány sajátos mozgalma, melynek tárgya a tudás kérdése. Ennek a mozgalomnak a részeként mesterséges neurális hálózatok segítségével próbálják megmagyarázni az emberi intellektuális képességeket. A neuronokhoz hasonlóan nagyszámú szerkezeti egységből álló neurális hálózatok az emberi agy egyszerűsített modelljei. Az ilyen típusú neurális hálózatokkal végzett kísérletek bebizonyították, hogy képesek megtanulni olyan feladatokat, mint a mintafelismerés, az olvasás és az egyszerű nyelvtani struktúrák azonosítása.

A filozófusok azért kezdtek érdeklődni a konnekcionizmus iránt, mert a konnekcionista megközelítés alternatívát ígért a klasszikus elmeelmélet és az azon belül széles körben elterjedt elképzelés mellett, miszerint az elme működése a szimbolikus nyelv digitális számítógép általi feldolgozásához hasonlít. Ez a koncepció igen vitatott, de az utóbbi években egyre több támogatóra talált.

A nyelv logikai vizsgálata folytatja a Saussure-i nyelv mint rendszer fogalmát. Az a tény, hogy folyamatosan folytatódik, ismét megerősíti a múlt század eleji tudományos találgatások merészségét. Munkám utolsó részét a matematikai módszerek mai nyelvészeti fejlesztési kilátásainak szentelem.

2.4 A matematikai módszerek nyelvtudományi alkalmazásának távlatai

A számítástechnika korszakában a matematikai nyelvészet módszerei új fejlődési perspektívát kaptak. A nyelvi elemzés problémáira való megoldáskeresés ma már egyre inkább szinten valósul meg információs rendszerek. Ugyanakkor a nyelvi anyag feldolgozási folyamatának automatizálása, miközben jelentős lehetőségeket és előnyöket biztosít a kutató számára, óhatatlanul új követelményeket, feladatokat támaszt a kutató számára.

A „pontos” és a „humanitárius” tudás kombinációja termékeny talajt jelent a nyelvészet, a számítástechnika és a filozófia új felfedezései számára.

Az egyik nyelvről a másikra történő gépi fordítás továbbra is az információs technológia gyorsan növekvő ága. Annak ellenére, hogy a számítógéppel végzett fordítás minőségében soha nem lesz összehasonlítható az ember által készített fordítással (főleg irodalmi szövegek esetében), a gép a nagy mennyiségű szöveg fordításának szerves asszisztensévé vált. Úgy gondolják, hogy a közeljövőben fejlettebb fordítórendszerek jönnek létre, amelyek elsősorban a szöveg szemantikai elemzésén alapulnak.

Ugyanilyen ígéretes irány marad a nyelvészet és a logika kölcsönhatása, amely filozófiai alapként szolgál az információs technológia és az úgynevezett „virtuális valóság” megértéséhez. A közeljövőben tovább folytatódik a mesterséges intelligenciarendszerek létrehozása – bár ez ismét képességeiben soha nem lesz egyenlő az emberi intelligenciával. Az ilyen versengés értelmetlen: korunkban egy gépnek nem riválissá, hanem emberi asszisztenssé kell válnia (és azzá válnia), nem valami a fantázia birodalmából, hanem a való világ részévé.

A nyelv tanulmányozása statisztikai módszerekkel folytatódik, ami lehetővé teszi a nyelv minőségi tulajdonságainak pontosabb meghatározását. Fontos, hogy a nyelvvel kapcsolatos legmerészebb hipotézisek matematikai, következésképpen logikai bizonyításra találjanak.

A legjelentősebb, hogy a matematika nyelvtudományi alkalmazásának különböző, korábban meglehetősen eltérő ágai az elmúlt években egymással korrelációba kerültek, koherens rendszerré egyesülve, a Ferdinánd által egy évszázaddal ezelőtt felfedezett nyelvrendszer analógiájával. de Saussure és Yvan Baudouin de Courtenay. Ez a tudományos ismeretek folytonossága.

A nyelvészet a modern világban az információs technológia fejlődésének alapjává vált. Amíg a számítástechnika az emberi tevékenység gyorsan fejlődő ága marad, a matematika és a nyelvészet egyesülése továbbra is betölti szerepét a tudomány fejlődésében.

Következtetés

A huszadik század során a számítástechnika hosszú utat tett meg – a katonai felhasználástól a békés felhasználásig, a szűk céltól az emberi élet minden területére való behatolásig. A matematika mint tudomány mindent újnak talált gyakorlati jelentősége a számítástechnika fejlődésével. Ez a folyamat ma is tart.

A „fizikusok” és „lírikusok” korábban elképzelhetetlen „tandemje” valósággá vált. A matematika és az informatika humán tudományokkal való teljes interakciójához mindkét oldalról képzett szakemberekre volt szükség. Míg a számítástechnikai szakembereknek egyre inkább szükségük van szisztematikus humanitárius (nyelvi, kulturális, filozófiai) tudásra, hogy megértsék az őket körülvevő valóság változásait, az ember és a technika kölcsönhatását, újabb és újabb nyelvi és mentális fogalmakat dolgozzanak ki, programokat írjanak, addig korunkban egy „humanistának” legalább a számítógéppel való munka alapjait el kell sajátítania ahhoz, hogy szakmailag fejlődjön.

A matematika, mivel szorosan összekapcsolódik a számítástechnikával, folyamatosan fejlődik, és kölcsönhatásba lép a természettudományi és humán ismeretekkel. Az új évszázadban a tudomány matematizálására irányuló tendencia nem gyengül, hanem éppen ellenkezőleg, felerősödik. Kvantitatív adatok felhasználásával megértjük a nyelvfejlődés mintázatait, történeti és filozófiai jellemzőit.

A matematikai formalizmus a legalkalmasabb a minták leírására a nyelvészetben (ahogyan más tudományokban is – mind a bölcsészettudományokban, mind a természettudományokban). A helyzet olykor úgy alakul a tudományban, hogy a megfelelő matematikai nyelv használata nélkül lehetetlen megérteni a fizikai, kémiai stb. folyamat lehetetlen. Az atom bolygómodelljének megalkotása, a XX. század híres angol fizikusa. E. Rutherford matematikai nehézségeket tapasztalt. Elméletét eleinte nem fogadták el: nem hangzott meggyőzően, ennek oka pedig az volt, hogy Rutherford nem ismeri a valószínűségelméletet, amelynek mechanizmusa alapján csak az atomi kölcsönhatások modellreprezentációját lehetett megérteni. Ezt felismerve egy akkoriban kiemelkedő tudós, Nobel-díjas beiratkozott Lamb matematikus professzor szemináriumára, és két éven át a hallgatókkal együtt tanfolyamon vett részt és dolgozott egy valószínűségszámítási műhelymunkán. Ennek alapján Rutherford képes volt leírni az elektron viselkedését, így szerkezeti modelljét meggyőző pontossággal és elismeréssel bírta. Így van ez a nyelvészettel is.

Ez felveti a kérdést, mi rejlik olyan matematikailag az objektív jelenségekben, ami alkalmassá teszi őket a matematika nyelvén, a mennyiségi jellemzők nyelvén történő leírásra? Ezek térben és időben eloszló homogén anyagegységek. Azok a tudományok, amelyek a többieknél messzebbre mentek a homogenitás azonosításában, alkalmasabbnak bizonyulnak a matematika alkalmazására.

Az internet, amely a 90-es években gyorsan fejlődött, egyesítette a különböző országok, népek és kultúrák képviselőit. Annak ellenére, hogy az angol továbbra is a nemzetközi kommunikáció fő nyelve, az internet napjainkban többnyelvűvé vált. Ez a kereskedelmileg sikeres gépi fordítórendszerek kifejlesztéséhez vezetett, amelyeket széles körben használnak az emberi tevékenység különböző területein.

Számítógépes hálózatok filozófiai elmélkedés tárgyává vált - egyre több új nyelvi, logikai, világnézeti koncepció született a „virtuális valóság” megértéséhez. Sok műalkotásban forgatókönyvek születtek - gyakran pesszimisták - a gépek dominanciájáról az emberek felett, és a virtuális valóság dominanciájáról a környező világ felett. Az ilyen előrejelzések nem mindig bizonyultak értelmetlennek. Az információs technológia nem csupán az emberi tudás befektetésének ígéretes területe, hanem az információ ellenőrzésének, következésképpen az emberi gondolkodásnak is egy módja.

Ennek a jelenségnek van negatív és pozitív oldala is. Negatív – mert az információ feletti kontroll ellentmond az információkhoz való szabad hozzáférés elidegeníthetetlen emberi jogának. Pozitív – mert ennek az ellenőrzésnek a hiánya katasztrofális következményekkel járhat az emberiség számára. Elég, ha felidézzük az elmúlt évtized egyik legbölcsebb filmjét - Wim Wenders „Amikor a világ véget ér”, amelynek szereplői teljesen elmerülnek álmaik „virtuális valóságában”, számítógépen rögzítették. Ugyanakkor egyetlen tudós vagy művész sem tud határozott választ adni arra a kérdésre: mi vár a tudományra és a technikára a jövőben.

A „jövőre” való összpontosítás, amely néha fantasztikusnak tűnik, a tudomány sajátos jellemzője volt a huszadik század közepén, amikor a feltalálók olyan tökéletes példákat akartak alkotni a technológiáról, amelyek emberi beavatkozás nélkül is működhetnek. Az idő megmutatta az ilyen kutatások utópisztikus természetét. Ugyanakkor felesleges lenne ezért elítélni a tudósokat - az 1950-es - 60-as évek lelkesedése nélkül az informatika a 90-es években nem hajtott volna ekkora ugrást, és nem lenne az, ami most van.

A huszadik század utolsó évtizedei megváltoztatták a tudomány prioritásait – a kutatás, a feltalálói pátosz átadta helyét a kereskedelmi érdeklődésnek. Ismétlem, ez se nem jó, se nem rossz. Ez egy olyan valóság, amelyben a tudomány egyre inkább beépül a mindennapi életbe.

A 21. század megjelenése ezt a tendenciát folytatta, és korunkban a találmányok mögött nem csak a hírnév és az elismerés áll, hanem mindenekelőtt a pénz. Ezért is fontos, hogy a tudomány és a technológia legújabb vívmányai ne kerüljenek terrorista csoportok vagy diktatórikus rendszerek kezébe. A feladat a lehetetlenségig nehéz; Ennek megvalósítása a lehető legnagyobb mértékben az egész világközösség feladata.

Az információ fegyver, és nem kevésbé veszélyes, mint a nukleáris vagy vegyi fegyver – csak nem fizikailag, hanem pszichológiailag hat. Az emberiségnek el kell gondolkodnia azon, hogy ebben az esetben mi a fontosabb számára - a szabadság vagy az ellenőrzés.

Az információs technológiák fejlődéséhez kapcsolódó legújabb filozófiai koncepciók és azok megértésére tett kísérletek egyaránt megmutatták a 19. században és a 20. század elején uralkodó természettudományos materializmus, valamint az anyagi világ jelentőségét tagadó szélsőséges idealizmus korlátait. A modern gondolkodás, különösen a nyugati gondolkodás számára fontos, hogy legyőzze ezt a gondolkodásbeli dualizmust, amikor a minket körülvevő világ egyértelműen anyagi és eszményi részekre oszlik. Az ehhez vezető út a kultúrák párbeszéde, az összehasonlítás különböző pontokat kilátás a környező jelenségekre.

Paradox módon az információs technológia fontos szerepet játszhat ebben a folyamatban. A számítógépes hálózatok és különösen az internet nemcsak a szórakoztatás és a lendületes kereskedelmi tevékenység forrásai, hanem a modern világ különböző civilizációinak képviselői közötti értelmes, ellentmondásos kommunikáció, valamint a múlt és a világ közötti párbeszéd eszközei is. ajándék. Elmondhatjuk, hogy az Internet kitágítja a térbeli és időbeli határokat.

A kultúrák információs technológia általi párbeszédében pedig továbbra is fontos a nyelv, mint a legrégebbi univerzális kommunikációs eszköz szerepe. Éppen ezért a nyelvészet a matematikával, a filozófiával és az informatikával kölcsönhatásban élte meg újjászületését, és a mai napig fejlődik. A jelen trendje a jövőben is folytatódni fog – „a világ végéig”, ahogyan ugyanez V. Wenders 15 évvel ezelőtt megjósolta. Igaz, nem tudni, mikor lesz ez a vég – de vajon most fontos-e, mert előbb-utóbb a jövő mégis jelen lesz.

1. számú melléklet

Ferdinand de Saussure

Ferdinand de Saussure (1857-1913) svájci nyelvészt széles körben a modern nyelvészet megalapítójának tartják, amikor megpróbálta leírni a nyelv szerkezetét, nem pedig egyes nyelvek és nyelvformák történetét. Valójában a strukturalizmus nyelv- és irodalomtudományi módszere és a szemiotika egy jelentős ága a huszadik század fordulóján találja fő kiindulópontját munkásságában. Még azt is elhangzik, hogy a stratégiák és felfogások komplexumát, amelyet „posztstrukturalizmusnak” neveztek el – Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes és mások munkája –, Saussure nyelvészeti munkái sugallják. és a késő latin költészet anagrammatikus olvasatai Ha ez így van, akkor ez a legvilágosabban abból látszik, ahogy Saussure nyelvészeti és értelmezési munkája részt vesz a megértés módozatainak átalakulásában a fizikától az irodalmi modernizmusig számos intellektuális tudományágban. század elején a pszichoanalízishez és a filozófiához. Ahogy Algirdas Julien Greimas és Joseph Courtes érvel a Szemiotika és nyelv: analitikus szótárban, „Interpretation” címszó alatt, a huszadik század elején új értelmezési mód jelent meg, amelyet a saussure-i nyelvészettel, a husserli fenomenológiával és a freudi pszichoanalízissel azonosítanak. Ebben a módban "az értelmezés többé nem arról szól, hogy egy adott tartalmat egy olyan formának tulajdonítunk, amelyből egyébként hiányozna, hanem egy parafrázis, amely más módon fogalmazza meg egy jelző elem egyenértékű tartalmát egy adott szemiotikai rendszeren belül" ( 159). Az "értelmezés" ebben a felfogásában a forma és a tartalom nem különbözik egymástól; hanem minden „forma” egyben szemantikai „tartalom”, „jelölő forma”, így az értelmezés analóg parafrázisát kínálja valaminek, ami már valamilyen más jelölési rendszeren belül jelöl.

A forma és a megértés ilyen újraértelmezése – amelyet Claude Levi-Strauss a strukturalizmus fogalmának egyik legprogramszerűbb megfogalmazásában, a "Struktúra és forma: Reflexiók Vladimir Propp egy művéről" című művében ír le - implicite benne van Saussure posztumusz kurzusában. Általános Nyelvészetben (1916, ford., 1959, 1983). Életében Saussure viszonylag keveset publikált, és fő műve, a Course az általa 1907–1911 között meghirdetett általános nyelvészeti kurzusok átirata volt. A kurzusban Saussure a nyelv „tudományos” tanulmányozását szorgalmazta, szemben a történeti nyelvészeti munkával, amelyet a 19. században végeztek. Ez a munka a nyugati intellektus egyik legnagyobb vívmánya: bizonyos szavakat vett építőköveiként. A nyelv, a történeti (vagy "diakrón") nyelvészet a nyugati nyelvek eredetét és fejlődését egy feltételezett köznyelvi forrásból követte nyomon, először egy "indoeurópai" nyelvből, majd egy korábbi "proto-indoeurópai" nyelvből.

Saussure pontosan ezt a szavak egyedi előfordulásának tanulmányozását kérdőjelezte meg, azzal a feltételezéssel, hogy a nyelv alapvető "egysége" valójában ezeknek a "szóelemeknek" a pozitív létezése. Munkája arra irányult, hogy a nyelvtörténeti nyelvészet által oly aprólékosan tanulmányozott nyelvi tények tömegét kezelhető számú tételre redukálja. A tizenkilencedik századi filológia „összehasonlító iskolája” – mondja Saussure a Kurzusban – „nem sikerült felállítania a nyelvészet igazi tudományát”, mert „nem sikerült felkutatnia vizsgálati tárgyának természetét” (3). Azt állítja, hogy ez a „természet” nem egyszerűen a nyelv által alkotott „elemi” szavakban – a nyelv látszólag „pozitív” tényeiben (vagy „szubsztanciáiban”) – keresendő, hanem azokban a formális kapcsolatokban, amelyek ezeket eredményezik. "anyagok".

Saussure szisztematikus újravizsgálása három feltevésen alapul, hogy a nyelv tudományos tanulmányozásának inkább a rendszert kell fejlesztenie és tanulmányoznia, mint a nyelvi jelenségek történetét. Emiatt különbséget tesz a nyelv sajátos előfordulásai között „beszédesemények”, amelyeket feltételes szabadságnak tervez – és a nyelvészet tulajdonképpeni tárgya, az ezeket az eseményeket irányító rendszer (vagy „kód”), amelyet nyelvként tervez egy ilyen szisztematikus vizsgálat ráadásul „szinkronizálást” igényel. a nyelv elemei közötti kapcsolat egy adott pillanatban való felfogása, nem pedig a nyelv történeti fejlődésének „diakrón” vizsgálata.

Ez a feltevés adta az okot, amit Roman Jakobson 1929-ben "strukturalizmusnak" nevezett el, amelyben "a kortárs tudomány által vizsgált jelenségek bármely halmazát nem mechanikus agglomerációként kezelik, hanem szerkezeti egészként a folyamatok mechanikus felfogása adja át a kérdést. funkciójukról" ("Romantic" 711). Ebben a részben Jakobson Saussure azon szándékát fogalmazza meg, hogy a nyelvészetet tudományos rendszerként határozza meg, szemben a történelmi véletlenek egyszerű, „mechanikus” elszámolásával. Ezzel együtt Jakobson a Saussure-i második alapfeltevés is – most már megtehetjük. nevezzük „strukturálisnak” – nyelvészetnek: hogy a nyelv alapelemeit csak funkcióikkal, nem pedig okaikkal összefüggésben lehet tanulmányozni, ahelyett, hogy sajátos és egyedi eseményeket és entitásokat (vagyis az adott indoeurópai történelem) vizsgálnánk "szavak"), azoknak az eseményeknek és entitásoknak olyan szisztematikus keretek között kell elhelyezkedniük, amelyekben más, úgynevezett eseményekhez és entitásokhoz kapcsolódnak. Cassirer összehasonlította „Galilei új tudományával, amely a 17. században megváltoztatta a fizikai világról alkotott elképzelésünket” (idézi Culler, Pursuit 24). Ez a változás, amint azt Greimas és Courtes megjegyzi, újrafogja az „értelmezést”, és így újragondolja magát a magyarázatot és a megértést. Ahelyett, hogy a magyarázat egy jelenség okaira vonatkozna, tehát mint "hatás", bizonyos szempontból alárendelve lenne okainak, a magyarázat itt abban áll, hogy egy jelenséget alárendelnek a jövőorientált "funkciójának", ill. "célja." A magyarázat már nem független az emberi szándékoktól vagy céloktól (még akkor is, ha ezek a szándékok lehetnek személytelenek, közösségiek vagy Freudi kifejezéssel "tudattalanok").

Nyelvészetében Saussure ezt az átalakulást kifejezetten a nyelvi „szó” újradefiniálásával valósítja meg, amelyet nyelvi „jelként” ír le, és funkcionalista fogalmakkal határoz meg. Érvelése szerint a jel a „fogalom és a hangkép” egyesülése, amelyet „jelöltnek és jelölőnek” nevezett (66-67; Roy Harris 1983-as fordítása a „signification” és a „signal” kifejezéseket kínálja). „kombinációjuk” annyiban „funkcionális”, hogy sem a jelölt, sem a jelölő nem „oka” a másiknak, hanem „egyik értékét a másiktól” (8). és szigorú elemzésnek veti alá a történeti nyelvészet alapfeltevését, nevezetesen a nyelv és a jelentés elemi egységeinek (azaz a „szavak”) azonosságát. Ennek oka, hogy a „fa” szó különböző előfordulásait a „ Ugyanaz a szó nem azért van, mert a szót inherens tulajdonságok határozzák meg – ez nem az ilyen tulajdonságok „mechanikai halmaza” –, hanem azért, mert egy rendszer elemeként, a nyelv „szerkezeti egészeként” van meghatározva.

Az entitás ilyen relációs (vagy "diakritikus") meghatározása szabályozza a nyelv összes elemének felfogását a szerkezeti nyelvészetben. Ez a Saussure-i nyelvészet leglenyűgözőbb vívmányában, a nyelv „fonémái” és „megkülönböztető jegyei” fogalmának kidolgozásában mutatkozik meg a legvilágosabban. A fonémák a nyelv legkisebb tagolt és jelző egységei. Nem a nyelvben előforduló hangok, hanem a Saussure által említett „hangképek”, amelyeket a beszélők – fenomenálisan felfogva – értelem közvetítőként fognak fel. (Így Elmar Holenstein Jakobson nyelvészetét, amely jelentős mértékben követi Saussure-t, „fenomenológiai strukturalizmusként” írja le.) Emiatt jegyezte meg a prágai iskolastrukturalizmus vezető szóvivője, Jan Mukarovsky 1937-ben, hogy „struktúra. . . fenomenológiai és nem empirikus valóság; nem maga a mű, hanem funkcionális kapcsolatok összessége, amelyek egy kollektíva tudatában (nemzedék, miliő stb.) helyezkednek el" (idézi Galan 35). Hasonlóan Levi-Strauss, a francia strukturalizmus vezető szóvivője 1960-ban megjegyezte, hogy "a szerkezetnek nincs külön tartalma; ez maga a tartalom, és a logikai szervezet, amelyben letartóztatják, a valódi tulajdonaként fogható fel” (167; lásd még Jakobson, Fundamentals 27-28).

A fonémák tehát, a nyelv legkisebb érzékelhető elemei nem pozitív tárgyak, hanem „fenomenológiai valóság”. Az angolban például a /t/ fonéma sokféleképpen kiejthető, de az angolul beszélő minden esetben /t/-ként funkcionál. A leszívott t (azaz egy h-szerű lélegzettel kiejtett t utána), egy magas vagy mély hangú t hang, egy kiterjesztett t hang stb., mind ugyanúgy funkcionál a szó jelentésének megkülönböztetésében. „to” és „do” angolul. Ezen túlmenően a nyelvek közötti különbségek olyanok, hogy az egyik nyelv fonológiai változatai külön fonémákat alkothatnak egy másik nyelvben; Így az angol különbséget tesz az /l/ és /r/ között, míg más nyelvek olyan szerkezetűek, hogy ezeket az artikulációkat ugyanazon fonéma variációinak tekintik (mint az angolban az aspirated és a unaspirated t). Minden természetes nyelvben a lehetséges szavak nagy száma kevés fonéma kombinációja. Az angol például kevesebb, mint 40 fonémával rendelkezik, amelyek együttesen több mint millió különböző szót alkotnak.

A nyelv fonémái önmagukban is szisztematikusan szervezett jellemzők struktúrái. Az 1920-as és 1930-as években Saussure példáját követve Jakobson és N. S. Trubetzkoy elkülönítették a fonémák „megkülönböztető vonásait”. Ezek a jellemzők a beszédszervek – nyelv, fogak, hangszálak és így tovább – fiziológiai szerkezetén alapulnak, Saussure a Kurzusban megemlíti, és amit Harris „fiziológiai fonetikaként” ír le (39; Baskin korábbi fordítása a „fonológia” kifejezést használja [(1959) 38]) – és ezek a bináris oppozíciók „kötegeiben” egyesülve fonémákat alkotnak. Például az angolban a /t/ és /d/ közötti különbség a „hang” megléte vagy hiánya (a vokálkordok elfoglaltsága), és a hangzás szintjén ezek a fonémák kölcsönösen meghatározzák egymást. Ily módon a fonológia sajátos példája a Saussure által leírt általános nyelvi szabálynak: A nyelvben csak különbségek vannak. Még ennél is fontosabb: a különbség általában pozitív kifejezéseket jelent, amelyek között a különbség létrejön; de a nyelvben csak pozitív kifejezések nélkül vannak különbségek. Akár a jelöltet, akár a jelölőt vesszük, a nyelvnek nincsenek olyan gondolatai, se hangjai, amelyek a nyelvi rendszer előtt léteztek. (120)

Ebben a keretben a nyelvi identitást nem az eredendő tulajdonságok, hanem a rendszerszerű ("strukturális") kapcsolatok határozzák meg.

Azt mondtam, hogy a fonológia „követte Saussure vezetését”, mert annak ellenére, hogy a nyelvi produkció fiziológiájával kapcsolatos elemzését „manapság – ahogy Harris mondja – „fizikainak” neveznék, szemben a „pszichológiai” vagy „funkcionális” kifejezéssel. "" (49. olvasás), ennek ellenére a Tanfolyamban megfogalmazta a nyelv funkcionális elemzésének irányát és körvonalait. Hasonlóan, egyetlen kiterjesztett publikált munkája, a Memoire sur le systeme primitif des voyelles dans les langues Indo-Europeennes (Emlékezés az indoeurópai nyelvek primitív magánhangzórendszeréről), amely 1878-ban jelent meg, teljes mértékben a XIX. századi nyelvtörténeti. Mindazonáltal ebben a munkában, ahogyan Jonathan Culler tárgyalta, Saussure bemutatta „a nyelvről mint tisztán relációs elemek rendszeréről való gondolkodás termékenységét, még akkor is, ha a történelmi rekonstrukció feladatán dolgozik” (Saussure 66). A fonémák közötti szisztematikus szerkezeti kapcsolatok elemzésével a létező indoeurópai nyelvekben előforduló magánhangzók váltakozási mintáinak figyelembevételével Saussure azt javasolta, hogy számos különböző fonéma /a/ mellett léteznie kellett egy másik fonémának is, amelyet formálisan le lehet írni. Culler az a tény teszi Saussure munkáját olyan lenyűgözővé, hogy közel ötven évvel később, amikor az ékírásos hettitát felfedezték és megfejtették, kiderült, hogy egy h betűs fonémát tartalmaz, amely úgy viselkedett, ahogy azt Saussure megjósolta. . Pusztán formai elemzéssel fedezte fel azt, amit ma az indoeurópai gégeként ismerünk” (66).

A szignifikáció elemeinek relációs vagy diakritikus meghatározásának ez a felfogása, amely implicit és explicit is a Kurzusban, egy harmadik, a strukturális nyelvészetet szabályozó feltételezést sugall, amit Saussure "a jel önkényes természetének" nevez. Ez alatt azt érti, hogy a jelölő és a jelölt kapcsolata a nyelvben soha nem szükséges (vagy "motivált"): az arbre hangjelzőt éppúgy megtalálni, mint a "fa" fogalommal egyesülő jelzőfát. De ennél több azt jelenti, hogy az aláírt önkényes is: a „fa” fogalmát éppoly könnyen meghatározhatjuk fás minőségével (ami kizárná a pálmafákat), mint méretével (ami kizárja az „alacsony fás szárú növényeket”). cserjék hívják). Ennek világossá kell tennie, hogy az általam bemutatott feltevések számozása nem jelent prioritási sorrendet: minden egyes feltételezés – a szignifikáció rendszerszerűsége (a legjobban a nyelv „szinkronikus” tanulmányozásával érthető meg), az elemek relációs vagy „diakritikus” természete. a szignifikáció, a jelek önkényes természete - értékét a többiből nyeri.

Vagyis a Saussure-i nyelvészet megérti az általa vizsgált jelenségeket a nyelv kombinációjának és kontrasztjának átfogó kapcsolataiban. Ebben a felfogásban a nyelv egyszerre a jelentés artikulálásának (szignifikációnak) és termékének (kommunikációnak) folyamata, és a nyelv e két funkciója sem nem azonos, sem nem teljesen kongruens (lásd Schleifer, „Dekonstrukció”). Itt láthatjuk azt a váltakozást a forma és a tartalom között, amelyet Greimas és Courtes ír le a modernista értelmezésben: a nyelv olyan kontrasztokat mutat fel, amelyek formálisan meghatározzák egységeit, és ezek az egységek a következő szinteken egyesülve hozzák létre a jelző tartalmat. Mivel a nyelv elemei tetszőlegesek, ráadásul sem a kontraszt, sem a kombináció nem mondható alapvetőnek. , a nyelvben a megkülönböztető jegyek a megértés másik szintjén kontrasztos fonémákat alkotnak, a fonémák egyesülve alkotnak Így a kontrasztos morfémák, a morfémák egyesülve alkotnak szavakat, a szavak egyesülve mondatokat alkotnak stb. Minden esetben az egész fonéma, szó, mondat stb. nagyobb, mint részeinek összege (ahogyan a víz, a H2O, Saussure példájában [(1959) 103] több, mint a mechanikai agglomeráció hidrogén és oxigén).

Az általános nyelvészeti kurzus három feltevése arra késztette Saussure-t, hogy a huszadik század új tudományát szorgalmazza, amely túlmutat a nyelvtudományon, és „a jelek életét a társadalomban” tanulmányozza. Saussure ezt a tudományt "szemiológiának (a görög szemeion "jel" szóból) nevezte el (16). A szemiotika "tudománya", ahogyan Kelet-Európában az 1920-as és 1930-as években, Párizsban pedig az 1950-es és 1960-as években kezdték gyakorolni, kiterjesztette a nyelv és a nyelvi struktúrák tanulmányozását az e struktúrák által alkotott (vagy artikulált) irodalmi műalkotásokra. Saussure pályafutása késői szakaszában, még az általános nyelvészeti kurzusok felkínálása közben is, a késői latin költészet saját „szemiotikai” elemzését folytatta, hogy felfedezze a tulajdonnevek szándékosan elrejtett anagrammáit. A vizsgálati módszer sok tekintetben ellentétes volt nyelvi elemzéseinek funkcionális racionalizmusával: megpróbálta szisztematikusan megvizsgálni a „véletlen” problémáját, amint azt Saussure a 99 jegyzetfüzet egyikében említi, amelyekben ezt a tanulmányt folytatta. mindennek elkerülhetetlen alapjává válik” (idézi Starobinski 101). Egy ilyen tanulmány, amint azt maga Saussure mondja, a véletlen és a jelentés „materiális tényére” összpontosít (101. idézve), így a „témaszó”, amelynek anagrammáját Saussure keresi, ahogy Jean Starobinski érvel, „a költő számára” , hangszer, nem pedig a vers létfontosságú csírája A vers köteles újra felhasználni a témaszó hanganyagait” (45). Ebben az elemzésben Starobinski azt mondja: "Saussure nem vesztette el magát a rejtett jelentések keresésében." Ehelyett úgy tűnik, hogy munkája a tudatból fakadó összes probléma kikerülésének vágyát demonstrálja: "Mivel a költészet nem csak szavakban valósul meg, hanem szavakból születik, elkerüli a tudat önkényes uralmát, hogy kizárólag egyfajta nyelvi törvényességtől függjön. " (121).

Vagyis Saussure kísérlete tulajdonnevek felfedezésére a késő latin költészetben – amit Tzvetan Todorov egy „szó” redukciójának nevez. . . jelölőjéhez" (266) - hangsúlyozza a nyelvi elemzését irányító egyik elemet, a jel önkényességét. (A sausure-i nyelvészet formai jellegét is hangsúlyozza - "A nyelv" - állítja - "forma és nem egy szubsztancia" – ami hatékonyan kiküszöböli a szemantikát mint az elemzés fő tárgyát.) Ahogy Todorov arra a következtetésre jut, Saussure munkája ma kifejezetten homogénnek tűnik, mivel nem hajlandó elfogadni a szimbolikus jelenségeket. . . . Az anagrammákkal kapcsolatos kutatásai során csak az ismétlés jelenségeire figyel, a felidézésre nem. . . . Nibelung-tanulmányaiban a szimbólumokat csak azért ismeri fel, hogy téves olvasatoknak tulajdonítsa őket: mivel nem szándékosak, szimbólumok nem léteznek. Végül általános nyelvészeti kurzusain a szemiológia, tehát a nyelvitől eltérő jelek létezésén elmélkedik; de ezt az állítást egyszerre korlátozza az a tény, hogy a szemiológia egyetlen jeltípusnak szentelte magát: az önkényes jeleknek. (269-70)

Ha ez igaz, az azért van, mert Saussure nem tudta felfogni a "szándékot" alany nélkül; nem tudta egészen kikerülni a forma és a tartalom ellentétét, munkája annyit tett, hogy megkérdőjelezze. Ehelyett a "nyelvi törvényességhez" folyamodott. Egyrészt a tizenkilencedik századi történelem-, szubjektivitás- és ok-okozati értelmezési módok között helyezkedik el, amelyeket ezek a felfogások irányítanak, másrészt pedig a huszadik századi „strukturalista” felfogások között helyezkedik el, amit Levi-Strauss a „kantianizmus nélkül” nevezett. transzcendentális szubjektum" (idézi Connerton 23) - olyan felfogások, amelyek eltörlik a forma és a tartalom (vagy szubjektum és tárgy) szembenállását, valamint az előtér és a háttér hierarchiáját a teljes strukturalizmusban, a pszichoanalízisben, sőt a kvantummechanikában - Ferdinand munkája de Saussure a nyelvészetben és a szemiotikában a jelentés és a kultúra tanulmányozásában egy jelzőpillanatot ír le.

Ronald Schleifer

2. függelék

Ferdinand de Saussure (fordítás)

Ferdinand de Saussure (1857-1913) svájci nyelvészt a modern nyelvészet megalapítójának tartják - annak köszönhetően, hogy megpróbálta leírni a nyelv szerkezetét, nem pedig az egyes nyelvek és szóformák történetét. Nagyjából a 20. század legelején rakták le munkáiban a nyelvészet és irodalomkritika strukturális módszereinek, nagyrészt a szemiotikai módszereinek alapjait. Bebizonyosodott, hogy az úgynevezett „posztstrukturalizmus” módszerei és koncepciói, amelyeket Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes és mások műveiben fejlesztettek ki, Saussure nyelvészeti munkáihoz és az anagrammatikus olvasatokhoz nyúlnak vissza. a késő római költészetből. Meg kell jegyezni, hogy Saussure nyelvészeti és nyelvértelmezési munkája segít áthidalni a szellemi tudományágak széles skáláját, a fizikától az irodalmi innovációig, a pszichoanalízisig és a huszadik század eleji filozófiáig. A. J. Greimas és J. Courtet így ír a „Semiotics and Language”-ben: „Az „Interpretation” című elemző szótár, mint újfajta értelmezés, a huszadik század elején jelent meg Saussure nyelvészetével, Husserl és Husserl fenomenológiájával. Freud pszichoanalízise. Ebben az esetben "az értelmezés nem az adott tartalom hozzárendelése egy olyan formához, amelyből egyébként hiányozna, hanem olyan parafrázis, amely egy adott szemiotikai rendszeren belül más módon fogalmazza meg egy jelentős elem ugyanazt a tartalmát" (159). . Az „értelmezés” ezen felfogásában a forma és a tartalom elválaszthatatlanok; éppen ellenkezőleg, minden formát áthat a szemantikai jelentés („értelmes forma”), így az értelmezés egy másik jelrendszerben valami jelentős dolog új, hasonló újramondását kínálja.

A forma és a tartalom hasonló felfogása, amelyet Claude Lévi-Strauss mutatott be a strukturalizmus egyik programszerű munkájában („Struktúra és forma: Reflexiók Vladimir Propp munkáiról”), látható Saussure posztumusz „Curse in General” című könyvében. Nyelvtudomány” (1916, ford., 1959, 1983). Saussure élete során keveset publikált, fő műve, az általános nyelvészeti előadásokat hallgató hallgatók jegyzeteiből állították össze. A The Course-ban Saussure a nyelv „tudományos” tanulmányozását szorgalmazta, szembeállítva azt a XIX. századi összehasonlító történeti nyelvészettel. Ez a munka a nyugati gondolkodás egyik legnagyobb vívmányának tekinthető: az egyes szavakat a nyelv szerkezeti elemeiként alapul véve a történeti (vagy „diakronikus”) nyelvészet bizonyította a nyugat-európai nyelvek eredetét és fejlődését egy közös, indoeurópai nyelv és egy korábbi protoindoeurópai nyelv.

Saussure pontosan ezt a szavak egyedi előfordulásának tanulmányozását kérdőjelezte meg, azzal a feltételezéssel, hogy a nyelv alapvető „egysége” valójában ezeknek a „szóelemeknek” a pozitív létezése. Munkája arra tett kísérletet, hogy az összehasonlító nyelvészet által véletlenül tanulmányozott nyelvi tényeket kevés tételre redukálja. A 19. századi összehasonlító filológiai iskolának – írja Saussure – „nem sikerült igazi nyelvészeti iskolát létrehoznia”, mert „nem értette meg a vizsgálat tárgyának lényegét” (3). Ez a "lényeg" szerinte nemcsak az egyes szavakban - a nyelv "pozitív szubsztanciáiban" - rejlik, hanem azokban a formai összefüggésekben is, amelyek e szubsztanciák létezését segítik elő.

Saussure nyelvi „próbája” három feltevésen alapul. Először is: a nyelv tudományos megértése nem történelmi, hanem szerkezeti jelenségen alapul. Ezért különbséget tett a nyelv egyéni jelenségei között – „beszédesemények”, amelyeket „parole”-ként definiál – és a nyelvészet megfelelő, véleménye szerint vizsgálati tárgyát, az ezeket az eseményeket irányító rendszert (kódot, szerkezetet). nyelv”). Egy ilyen szisztematikus tanulmányozáshoz ráadásul szükség van a nyelv elemei közötti kapcsolatok „szinkron” felfogására. Ebben a pillanatban, nem pedig a nyelv fejlődésének „diakrónikus” tanulmányozása történetén keresztül.

Ez a hipotézis lett az előfutára annak, amit Roman Jakobson 1929-ben „strukturalizmusnak” hívott – egy olyan elméletnek, amelyben „a modern tudomány által vizsgált jelenségek bármely halmazát nem mechanikus felhalmozódásnak tekintik, hanem strukturális egésznek, amelyben a konstruktív komponens korrelál funkció” („Romantic” 711). Ebben a részben Jakobson megfogalmazta Saussure gondolatát, hogy a nyelvet szerkezetként határozza meg, szemben a történelmi események „gépi” felsorolásával. Mindemellett Jacobson egy másik, a szerkezeti nyelvészet előfutárává vált Saussure-i feltevést is kidolgoz: a nyelv alapelemeit nem annyira okaikkal, hanem funkcióikkal összefüggésben kell vizsgálni. Az egyes jelenségeket, eseményeket (mondjuk az egyes indoeurópai szavak keletkezésének történetét) nem önmagukban kell tanulmányozni, hanem olyan rendszerben, amelyben hasonló összetevőkkel korrelálnak. Ez radikális fordulat volt a jelenségek a környező valósággal való összehasonlításában, amelynek jelentőségét Ernst Cassirer filozófus „Galileo tudományához” hasonlította, amely a tizenhetedik században megdöntötte az anyagi világról alkotott elképzeléseket. amint azt Greimas és Kurte megjegyzik, megváltoztatja az „értelmezés” fogalmát, és ennek következtében magukat a magyarázatokat nem az előfordulásuk okaival összefüggésben kezdték értelmezni, hanem a jelenben gyakorolt ​​hatásuk alapján. és az értelmezés megszűnt független lenni az emberi szándékoktól (annak ellenére, hogy a szándékok lehetnek személytelenek, a szó freudi értelmében).

Saussure nyelvészetében különösen mutatja ezt a fordulatot a szó fogalmának változásában a nyelvtudományban, amelyet jelként határoz meg és funkciói alapján ír le. Számára a jel a hang és a jelentés kombinációja, a „signified and designation” (66-67; Roy Harris 1983-as angol fordításában - „signification” és „signal”). Ennek a kapcsolatnak a természete „funkcionális” (sem egyik, sem a másik elem nem létezhet a másik nélkül); sőt, „az egyik minőséget kölcsönöz a másiktól” (8). Így Saussure meghatározza a nyelv fő szerkezeti elemét - a jelet -, és a történeti nyelvészet alapjául a jelek szavakkal való azonosságát teszi, ami különösen szigorú elemzést igényel. Ezért megérthetjük, mondjuk, ugyanannak a „fa” szónak a különböző jelentését – nem azért, mert a szó csak bizonyos tulajdonságok összessége, hanem azért, mert egy jelrendszer elemeként, egy „szerkezeti egészben” van meghatározva. nyelvben.

Ez a relatív („diakritikus”) egységfogalom alapozza meg a strukturális nyelvészetben a nyelv minden elemére vonatkozó koncepciót. Ez különösen jól látható a Saussure-i nyelvészet legeredetibb felfedezésében, a „fonémák” és a „fonémák” fogalmának kidolgozásában. megkülönböztető jellegzetességek» nyelv. A fonémák a nyelv legkisebb kiejthető és értelmes egységei. Ezek nem csak egy nyelvben található hangok, hanem „hangképek” – jegyzi meg Saussure, amelyeknek az anyanyelvi beszélők jelentést kapnak. (Megjegyzendő, hogy Elmar Holenstein Jakobson nyelvészetét, amely a főbb rendelkezések szerint folytatja Saussure gondolatait és koncepcióit, „fenomenológiai strukturalizmusnak” nevezi. Ezért figyelte meg 1937-ben a prágai strukturalizmus iskola vezető szónoka, Jan Mukarovsky, hogy „a struktúra. . . nem empirikus, hanem fenomenológiai fogalom; ez nem maga az eredmény, hanem a kollektív tudat (egy nemzedék, mások stb.) jelentős kapcsolatainak összessége.” Hasonló gondolatot fogalmazott meg 1960-ban Lévi-Strauss, a francia strukturalizmus vezetője: „A struktúrának nincs határozott tartalma; önmagában is értelmes, és a logikai struktúra, amelyben benne van, a valóság lenyomata.”

A fonémák pedig, mint az észlelés számára elfogadható legkisebb nyelvi elemek, különálló, integrált „fenomenológiai valóságot” képviselnek. Például az angolban a "t" hangot többféleképpen lehet kiejteni, de az angolul beszélő személy minden esetben "t"-ként fogja fel. Aspirációval, magas vagy alacsony nyelvemeléssel ejtve egy hosszú „t” stb. hang egyaránt megkülönbözteti a „to” és a „do” szavak jelentését. Ezen túlmenően a nyelvek közötti különbségek olyanok, hogy az egyik hang változatai egy nyelven különböző fonémáknak felelhetnek meg egy másikban; például az „l” és az „r” különbözik az angolban, míg más nyelveken ugyanannak a fonémának a változatai (mint például az angol „t”, ejtve aspirated és unaspirated). Bármely természetes nyelv hatalmas szókincse sokkal kisebb számú fonéma kombinációinak gyűjteménye. Az angolban például csak 40 fonémát használnak körülbelül egymillió szó kiejtésére és írására.

A nyelv hangjai a jellemzők szisztematikusan szervezett halmazát képviselik. Az 1920-as és 1930-as években, Saussure nyomán, Jacobson és N. S. Trubetskoy azonosította a fonémák „megkülönböztető vonásait”. Ezek a jellemzők a beszédszervek - nyelv, fogak, hangszálak - szerkezetén alapulnak - ezt Saussure megjegyzi az Általános Nyelvészeti Tanfolyamban, Harris pedig "fiziológiai fonetikának" nevezi (Baskin egy korábbi fordítása a "fonológia" kifejezést használja ). Tegyük fel, hogy angolul a „t” és a „d” közötti különbség a „hang” jelenléte vagy hiánya (a hangszálak feszültsége), valamint a hangszint, amely megkülönbözteti az egyik fonémát a másiktól. Így a fonológia a Saussure által leírt általános nyelvi maxima példájának tekinthető: „A nyelvben csak különbségek vannak”. Még csak nem is ez a fontos: a különbség általában magában foglalja azokat a pontos feltételeket, amelyek között van; de a nyelvben csak különbségek vannak pontos feltételek nélkül. Mindegy, hogy „jelesnek” vagy „jelzettnek” tekintjük – a nyelvben nincsenek olyan fogalmak vagy hangok, amelyek a nyelvi rendszer kialakulása előtt léteztek.

Egy ilyen struktúrában a nyelvi analógiákat nem az eredendő tulajdonságaik, hanem a rendszerszerű („strukturális”) kapcsolatok határozzák meg.

Már említettem, hogy a fonológia fejlődése során Saussure gondolataira épült. Annak ellenére, hogy korunk nyelvi fiziológiájának elemzését Harris szerint „fizikainak” neveznék, szemben a „pszichológiai” vagy „funkcionális” kifejezéssel, a Kurzusban világosan megfogalmazta a funkcionális irányvonalat és alapelveit. nyelv elemzése. Életében egyetlen, 1878-ban megjelent munkája, a Memoire sur le systeme primitif des voyelles dans les langues indo-europeennes (Jegyzetek az indoeurópai nyelvek eredeti magánhangzórendszeréhez) teljes mértékben összhangban volt az összehasonlító történeti nyelvészettel. a 19. század. Mindazonáltal ezzel a munkával, ahogy Jonathan Culler mondja, Saussure megmutatta „a nyelv, mint egymással összefüggő jelenségek rendszerének eszméjének gyümölcsözőségét, még a történelmi rekonstrukciójával is”. A fonémák közötti kapcsolatokat elemezve, a magánhangzók váltakozását magyarázva az indoeurópai csoport modern nyelveiben, Saussure azt javasolta, hogy számos különböző „a” hang mellett más fonémáknak is kell lenniük, amelyeket formálisan írnak le. „Ami különösen lenyűgöző Saussure munkásságában – fejezi be Culler –, hogy csaknem 50 évvel később, a hettita ékírás felfedezésével és megfejtésével „h”-ként írt fonémát találtak, amely úgy viselkedett, ahogy azt Saussure megjósolta. Formai elemzéssel fedezte fel az indoeurópai nyelvekben ma glottális hangot.

A jelek relatív (diakritikus) definíciójának koncepciójában, amelyet a kurzus kifejezetten kifejezett és implikált, a strukturális nyelvészet harmadik kulcsfeltevésében szerepel, amelyet Saussure a „jel önkényes természetének” nevez. Ez azt jelenti, hogy a hang és a jelentés kapcsolata a nyelvben motiválatlan: az „arbre” szót és a „fa” szót ugyanilyen könnyen összekapcsolhatjuk a „fa” fogalommal. Sőt, ez azt jelenti, hogy a hang is tetszőleges: a „fa” fogalmát a kéreg jelenléte (kivéve a pálmafák) és a méret (kivéve az „alacsony fás szárú növényeket” - cserjéket) határozhatja meg. Ebből világossá kell tenni, hogy az általam bemutatott feltevések nincsenek többé-kevésbé fontos részekre osztva: mindegyik - a jelek szisztematikus jellege (a nyelv „szinkron” tanulmányozása során a leginkább érthető), relatív (diakritikus) lényegük, a jelek önkényes természete – a többiből származik.

Így a Saussure-i nyelvészetben a vizsgált jelenséget a nyelv összehasonlításának és ellentéteinek összességeként értelmezik. A nyelv a szavak jelentésének kifejezője (megjelölés) és eredménye (kommunikációja) – és ez a két funkció soha nem esik egybe (lásd Shleifer „A nyelv dekonstrukciója”). A Greimas és Courtet által leírt forma és tartalom váltakozását az értelmezés legújabb változatában figyelhetjük meg: a nyelvi ellentétek határozzák meg szerkezeti egységeit, és ezek az egységek egymást követő szinteken kölcsönhatásban hoznak létre egy bizonyos értelmes tartalmat. Mivel a nyelv elemei véletlenszerűek, sem kontraszt, sem kombináció nem lehet az alap. Ez azt jelenti, hogy egy nyelvben a megkülönböztető jegyek fonetikai kontrasztot alkotnak a megértés különböző szintjén, a fonémák kontrasztos morfémákká, a morfémák szavakká, a szavak mondatokká stb. Mindenesetre egy egész fonéma, szó, mondat stb. több, mint részeinek összege (ahogyan Saussure példájában a víz is több, mint a hidrogén és az oxigén kombinációja).

Az általános nyelvészet kurzusának három feltevése vezette Saussure-t a huszadik század új, a nyelvészettől elkülönülő tudományának gondolatához, amely „a jelek életét a társadalomban” tanulmányozza. Saussure ezt a tudományt szemiológiának nevezte (a görög „semeion” - jelből). Az 1920-as és 1930-as években Kelet-Európában, az 1950-es és 1960-as években Párizsban kifejlődött szemiotika "tudománya" kiterjesztette a nyelv és a nyelvi struktúrák vizsgálatát az e struktúrák felhasználásával megkomponált (vagy megfogalmazott) irodalmi eredményekre. Szintén pályafutása végén, az általános nyelvészeti kurzusával párhuzamosan, Saussure a késő római költészet "szemiotikai" elemzését végezte, megkísérelve felfedezni a tulajdonnevek szándékosan összeállított anagrammáit. Ez a módszer nyelvi elemzésében sok tekintetben a racionalizmus ellentéte volt: kísérlet volt, ahogy Saussure 99 jegyzetfüzete egyikében írja, egy rendszerben vizsgálni a „valószínűség” problémáját, amely „mindennek az alapja lesz. ” Az ilyen kutatások, ahogyan Saussure maga is állítja, segít a valószínűség „anyagi oldalára” összpontosítani; A „kulcsszó”, amelynek anagrammáját Saussure keresi, ahogy Jean Starobinsky állítja, „eszköz a költő számára, és nem a vers életének forrása. A vers arra szolgál, hogy megfordítsa a kulcsszó hangjait.” Starobinsky szerint ebben az elemzésben "Saussure nem mélyed el a rejtett jelentések keresésében". Éppen ellenkezőleg, műveiben észrevehető a tudattal kapcsolatos kérdések elkerülésének vágya: „mivel a költészet nemcsak szavakban fejeződik ki, hanem abban is, amit ezek a szavak generálnak, túlmutat a tudat irányításán, és csak a törvényektől függ. a nyelvről.”

Saussure kísérlete a tulajdonnevek tanulmányozására a késő római költészetben (Tsvetan Todorov „a szó... közvetlenül az írás előtt” összehúzódásának nevezte) kiemeli nyelvi elemzésének egyik összetevőjét – a jelek önkényességét, valamint a Saussure-i nyelvészet formai esszenciája („A nyelv” – érvel – „a lényeg a forma, nem a jelenség”), amely kizárja a jelentéselemzés lehetőségét. Todorov arra a következtetésre jut, hogy manapság Saussure írásai rendkívül következetesnek tűnnek abban, hogy vonakodnak a szimbólumok (világosan meghatározott jelentéssel bíró jelenségek) tanulmányozásától. . . . Az anagrammák tanulmányozása során Saussure csak az ismétlésre figyel, a korábbi változatokra nem. . . . A Nibelungok tanulmányozása során a szimbólumokat csak azért azonosítja, hogy hibás olvasatokhoz rendelje őket: ha nem szándékosak, akkor nem léteznek szimbólumok. Hiszen általános nyelvészeti írásaiban egy olyan szemiológia létezését sugallja, amely nemcsak nyelvi jeleket ír le; de ennek a feltevésnek korlátot szab az a tény, hogy a szemiológia csak véletlenszerű, önkényes jeleket tud leírni.

Ha ez valóban így van, csak azért, mert nem tudta elképzelni a „szándékot” tárgy nélkül; nem tudta teljesen leküzdeni a forma és a tartalom közötti szakadékot - műveiben ez kérdéssé vált. Ehelyett a „nyelvi törvényességre” hivatkozott. Egyrészt a tizenkilencedik századi történelemre és szubjektív sejtésekre épülő fogalmak, másrészt az ezekre épülő esetleges értelmezési módszerek, másrészt a strukturalista koncepciók között helyezkedik el, amelyeket Lévi-Strauss „transzcendentális kantianizmusnak” nevezett. ágens” – a forma és a tartalom (szubjektum és tárgy), a jelentés és eredet ellentétének eltörlése a strukturalizmusban, a pszichoanalízisben, sőt a kvantummechanikában – Ferlinand de Saussure nyelvészeti és szemiotikai munkái fordulópontot jelentenek a nyelv és a kultúra jelentésének vizsgálatában.

Ronald Shleifer

Irodalom

1. Admoni V.G. A nyelvtan elméletének alapjai / V.G. Admony; Szovjetunió Tudományos Akadémia.-M.: Nauka, 1964.-104p.

3. Arapov, M.V., Herts, M.M. Matematikai módszerek a nyelvészetben. M., 1974.

4. Arnold I.V. Egy szó szemantikai felépítése a modern angol nyelvben és kutatásának módszerei. /I.V. Arnold-L.: Nevelés, 1966. - 187 p.

6. Bashlikov A.M. Automatizált fordítórendszer. / A.M. Bashlykov, A.A. Szokolov. - M.: FIMA Kft., 1997. - 20 p.

7. Baudouin de Courtenay: Elméleti örökség és modernitás: A nemzetközi tudományos konferencia beszámolóinak absztraktjai / I.G. Kondratieva. - Kazan: KSU, 1995. - 224 p.

8. Gladky A.V., A matematikai nyelvészet elemei. / . Gladky A.V., Melchuk I.A. -M., 1969. - 198 p.

9. Golovin, B.N. Nyelv és statisztika. /B.N. Golovin - M., 1971. - 210 p.

10. Zvegintsev, V.A. Elméleti és alkalmazott nyelvészet. / V.A. Zvegintsev - M., 1969. - 143 p.

11. Kasevich, V.B. Szemantika. Szintaxis. Morfológia. // V.B. Kasevich -M., 1988. - 292 p.

12. Lekomtsev Yu.K. BEVEZETÉS a nyelvészet formanyelvébe / Yu.K. Lekomcev. - M.: Nauka, 1983, 204 pp., ill.

13. Baudouin de Courtenay nyelvi öröksége a huszadik század végén: A 2000. március 15-18-i nemzetközi tudományos és gyakorlati konferencia beszámolóinak kivonata. - Krasznojarszk, 2000. - 125 p.

Matveeva G.G. Rejtett nyelvtani jelentések és a beszélő társas személyének azonosítása („portré”) / G.G. Matveeva. - Rosztov, 1999. - 174 p.

14. Melchuk, I.A. "Jelentés" nyelvi modellek felépítésében szerzett tapasztalat<-->Szöveg."/ I.A. Melchuk. - M., 1974. - 145 p.

15. Nelyubin L.L. Fordítás és alkalmazott nyelvészet/L.L. Nelyubin. - M.: Felsőiskola, 1983. - 207 p.

16. A nyelvkutatás egzakt módszereiről: az úgynevezett „matematikai nyelvészetről” / O.S. Akhmanova, I. A. Melchuk, E. V. Paducheva et al. - M., 1961. - 162 p.

17. Piotrovsky L.G. Matematikai nyelvészet: Tankönyv / L.G. Piotrovsky, K.B. Bektaev, A.A. Piotrovszkaja. - M.: Felsőiskola, 1977. - 160 p.

18. Ugyanaz. Szöveg, gép, ember. - L., 1975. - 213 p.

19. Ugyanaz. Alkalmazott nyelvészet / Szerk. A.S. Gerda. - L., 1986. - 176 p.

20. Revzin, I.I. A nyelv modelljei. M., 1963. Revzin, I.I. Modern szerkezeti nyelvészet. Problémák és módszerek. M., 1977. - 239 p.

21. Revzin, I. I., Rosenzweig, V. Yu. Az általános és gépi fordítás alapjai/Revzin I.I., Rosenzweig, V.Yu. - M., 1964. - 401 p.

22. Slyusareva N.A. F. de Saussure elmélete a modern nyelvészet tükrében / N.A. Slyusareva. - M.: Nauka, 1975. - 156 p.

23. Bagoly, L.Z. Analitikus nyelvészet/ L.Z. Bagoly - M., 1970. - 192 p.

24. Saussure F. de. Megjegyzések az általános nyelvészethez / F. de Saussure; Per. fr. - M.: Haladás, 2000. - 187 p.

25. Ugyanaz. Általános nyelvészet tantárgy / Ford. fr. - Jekatyerinburg, 1999. -426 p.

26. Beszédstatisztika és automatikus szövegelemzés / Rep. szerk. R.G. Piotrovszkij. L., 1980. - 223 p.

27. Stoll, P. Szettek. Logika. Axiomatikus elméletek./ R. Stoll; Per. angolról - M., 1968. - 180 p.

28. Tenier, L. A szerkezeti szintaxis alapjai. M., 1988.

29. Ubin I.I. A fordítási tevékenységek automatizálása a Szovjetunióban / I.I. Ubin, L. Yu. Korostelev, B.D. Tikhomirov. - M., 1989. - 28 p.

30. Faure, R., Kofman, A., Denis-Papin, M. Modern matematika. M., 1966.

31. Schenk, R. Fogalmi információfeldolgozás. M., 1980.

32. Shikhanovich, Yu.A. BEVEZETÉS a modern matematikába (kezdeti fogalmak). M., 1965

33. Shcherba L.V. Orosz magánhangzók minőségi és mennyiségi értelemben / L.V. Shcherba - L.: Nauka, 1983. - 159 p.

34. Abdulla-zade F. Világpolgár // Ogonyok - 1996. - 5. sz. - 13. o

35. V.A. Uszpenszkij. Előszó az Új Irodalmi Szemle olvasói számára Andrej Nyikolajevics Kolmogorov szemiotikai üzeneteihez. - Új Irodalmi Szemle. -1997. - 24. sz. - P. 18-23

36. Perlovsky L. Tudat, nyelv és kultúra. - A tudás hatalom. -2000. 4. szám - 20-33

Bevezetés?

Bevezetés

1. fejezet A matematikai módszerek nyelvtudományi alkalmazásának története

Előadás fordításelmélet

1.2. Matematikai módszerek alkalmazása a nyelvészetben a huszadik század második felében

2. fejezet Válogatott példák a matematika nyelvtudományi felhasználására

2.1. Gépi fordítás

2.2.Statisztikai módszerek a nyelvtanulásban

2.3. Nyelvtanulás formális logikai módszerekkel

2.4. A matematikai módszerek nyelvtudományi alkalmazásának távlatai

Következtetés

Irodalom

1. melléklet Ronald Schleifer. Ferdinand de Saussure

2. függelék Ferdinand de Saussure (fordítás)

Bevezetés

1.1. A szerkezeti nyelvészet kialakulása a 19-20. század fordulóján

A huszadik században folytatódott a különböző tudásterületek interakciója és áthatolása felé irányuló tendencia. Az egyes tudományok közötti határok fokozatosan elmosódnak; A szellemi tevékenységnek egyre több olyan ága van, amely a humanitárius, műszaki és természettudományi ismeretek „metszéspontjában” áll.

Tantárgyi munkám célja, hogy röviden rávilágítsak a matematika és a nyelvtudomány egy olyan ága, mint a nyelvészet kapcsolatára. A múlt század 50-es évei óta a matematikát a nyelvészetben használták a nyelvek (természetes és mesterséges) szerkezetének leírására szolgáló elméleti apparátus létrehozására. Meg kell azonban mondani, hogy nem talált azonnal ilyen gyakorlati alkalmazást. Kezdetben a nyelvészetben a matematikai módszereket kezdték alkalmazni a nyelvtudományi alapfogalmak tisztázására, de a számítástechnika fejlődésével egy ilyen elméleti előfeltevés a gyakorlatban is elkezdődött. Az olyan problémák megoldása, mint a gépi fordítás, a gépi információkeresés és az automatikus szövegfeldolgozás, alapvetően új nyelvi megközelítést igényelt. Felmerült a kérdés a nyelvészekben: hogyan lehet megtanulni a nyelvi mintákat olyan formában ábrázolni, hogy azok közvetlenül alkalmazhatók legyenek a technológiában. A korunkban elterjedt „matematikai nyelvészet” kifejezés minden olyan nyelvészeti kutatásra vonatkozik, amely egzakt módszereket alkalmaz (és a tudományban az egzakt módszerek fogalma mindig szorosan összefügg a matematikával). Az elmúlt évek tudósai egy része úgy véli, hogy magát a kifejezést nem lehet egy kifejezés rangjára emelni, hiszen nem jelöl semmiféle speciális „nyelvészetet”, csak egy új irányt, amely a nyelvkutatási módszerek javítására, pontosságának és megbízhatóságának növelésére irányul. A nyelvészet kvantitatív (algebrai) és nem kvantitatív módszereket egyaránt alkalmaz, ami közelebb viszi a matematikai logikához, következésképpen a filozófiához, sőt a pszichológiához is. Schlegel is felhívta a figyelmet a nyelv és a tudat kölcsönhatására, és a huszadik század elejének kiemelkedő nyelvésze, Ferdinand de Saussure (a nyelvtudományi matematikai módszerek fejlődésére gyakorolt ​​hatásáról a későbbiekben szólok) a nyelv szerkezetét összekapcsolta egy nyelvhez való tartozásával. emberek. L. Perlovsky modern kutató tovább megy, egy nyelv kvantitatív jellemzőit (például nemek számát, esetek számát) a nemzeti mentalitás jellemzőivel azonosítja (erről bővebben a 2.2. „Nyelvtudományi statisztikai módszerek” című részben).

A matematika és a nyelvészet kölcsönhatása sokrétű téma, munkámban nem mindegyikre, hanem mindenekelőtt annak alkalmazott vonatkozásaira térek ki.

I. fejezet A matematikai módszerek nyelvtudományi alkalmazásának története

1.1 A szerkezeti nyelvészet kialakulása a 19-20. század fordulóján

A nyelv matematikai leírása a nyelv mint mechanizmus elgondolásán alapul, amely a huszadik század elejének híres svájci nyelvészéhez, Ferdinand de Saussure-hoz nyúlik vissza.

Koncepciójának kiinduló láncszeme a nyelv elmélete, mint három részből álló rendszer (maga a nyelv - nyelv, beszéd - Jelszóés beszédtevékenység – nyelvet), amelyben minden szót (a rendszer tagját) nem önmagában, hanem más tagokkal összefüggésben tekintjük. Amint egy másik kiemelkedő nyelvész, a dán Louis Hjelmslev később megjegyezte, Saussure „elsőként követelte meg a nyelv strukturális megközelítését, vagyis a nyelv tudományos leírását az egységek közötti kapcsolatok rögzítésével”.

A nyelvet hierarchikus struktúraként értelmezve Saussure volt az első, aki felvetette a nyelvi egységek értékének és jelentőségének problémáját. Az egyes jelenségeket, eseményeket (mondjuk az egyes indoeurópai szavak keletkezésének történetét) nem önmagukban kell tanulmányozni, hanem olyan rendszerben, amelyben hasonló összetevőkkel korrelálnak.

Saussure a nyelv szerkezeti egységének a szót, a „jelet” tekintette, amelyben a hang és a jelentés egyesült. Ezek az elemek egyike sem létezik egymás nélkül: ezért az anyanyelvi beszélő egy poliszemantikus szó különböző jelentésárnyalatait a szerkezeti egészben, a nyelvben különálló elemként érti.

F. de Saussure elméletében tehát látható a nyelvészet kölcsönhatása egyrészt a szociológiával és a szociálpszichológiával (megjegyzendő, hogy egy időben alakult ki Husserl fenomenológiája, Freud pszichoanalízise, ​​Einstein relativitáselmélete irodalomban, zenében és képzőművészetben formai és tartalmi kísérletek folynak, másrészt matematikával (a rendszeresség fogalma a nyelv algebrai fogalmának felel meg). Ez a fogalom megváltoztatta a nyelvi értelmezés fogalmát mint olyat: a jelenségeket nem előfordulásuk okaihoz viszonyítva kezdték értelmezni, hanem a jelenhez és a jövőhöz viszonyítva. Az értelmezés már nem független az ember szándékaitól (annak ellenére, hogy a szándékok lehetnek személytelenek, a szó freudi értelmében „tudattalanok”).

A nyelvi mechanizmus működése az anyanyelvi beszélők beszédtevékenységén keresztül nyilvánul meg. A beszéd eredménye az úgynevezett „helyes szövegek” - beszédegységek sorozatai, amelyek engedelmeskednek bizonyos mintáknak, amelyek közül sok lehetővé teszi a matematikai leírást. A szintaktikai struktúra leírására szolgáló módszerek elmélete a helyes szövegek (elsősorban mondatok) matematikai leírásának módszereivel foglalkozik. Egy ilyen struktúrában a nyelvi analógiákat nem az eredendő tulajdonságaik, hanem a rendszerszerű („strukturális”) kapcsolatok segítségével határozzák meg.

Nyugaton Saussure gondolatait a nagy svájci nyelvész fiatalabb kortársai dolgozzák ki: Dániában – a már említett L. Hjelmslev –, aki „A nyelvelmélet alapjai” című munkájában az algebrai nyelvelméletet szülte, az USA-ban – E. Sapir, L. Bloomfield, C. Harris, Csehországban - N. Trubetskoy orosz emigráns tudós.

A nyelvtanulás statisztikai mintáit nem más kezdte el tanulmányozni, mint a genetika megalapítója, Georg Mendel. A filológusok csak 1968-ban fedezték fel, hogy élete utolsó éveiben szívesen tanulmányozta a nyelvi jelenségeket matematikai módszerekkel. Mendel ezt a módszert a biológiából hozta a nyelvészetbe; a 19. század kilencvenes éveiben csak a legmerészebb nyelvészek és biológusok nyilatkoztak egy ilyen elemzés megvalósíthatóságáról. A Szt. kolostor archívumában. Tomas Brünnben, ahol Mendel apát volt, lapokat találtak „mann”, „bauer”, „mayer” végződésű vezetéknevek oszlopaival, valamint néhány törtszámmal és számítással. Mendel a családnevek eredetének formai törvényszerűségeinek feltárása érdekében összetett számításokat végez, amelyek során figyelembe veszi a német nyelv magán- és mássalhangzóinak számát, az általa figyelembe vett szavak teljes számát, a vezetéknevek számát, stb.

Nálunk a szerkezeti nyelvészet nagyjából a nyugatival egy időben - a 19-20. század fordulóján - kezdett kifejlődni. F. de Saussure-ral egyidőben a nyelv mint rendszer fogalmát a kazanyi egyetem professzora, F.F. Fortunatov és I.A. Baudouin de Courtenay. Utóbbi ennek megfelelően hosszú ideig levelezett de Saussure-ral, a genfi ​​és a kazanyi nyelvészeti iskola együttműködött egymással. Ha Saussure-t a nyelvészet „egzakt” módszereinek ideológusának nevezhetjük, akkor ezek alkalmazásának gyakorlati alapjait Baudouin de Courtenay fektette le. Ő volt az első, aki különválasztotta a nyelvészetet (pl pontos statisztikai módszereket és funkcionális függőséget alkalmazó tudomány) a filológián (a spirituális kultúrát nyelven és beszéden keresztül vizsgáló humanitárius tudományágak közössége). Maga a tudós úgy vélte, hogy „a nyelvészet csak akkor lehet hasznos a közeljövőben, ha megszabadul a filológiával és az irodalomtörténettel való kötelező egyesüléstől”. A fonológia lett a matematikai módszerek nyelvtudományi bevezetésének „próbaterepe” - a hangok, mint a nyelvi rendszer „atomjai”, korlátozott számú, könnyen mérhető tulajdonsággal rendelkeztek, a formális, szigorú leírási módszerek legkényelmesebb anyaga. A fonológia tagadja a hang jelentésének jelenlétét, így a kutatás során az „emberi” tényezőt kiiktatták. Ebben az értelemben a fonémák olyanok, mint a fizikai vagy biológiai tárgyak.

A fonémák, mint az észlelés számára elfogadható legkisebb nyelvi elemek, külön szférát, külön „fenomenológiai valóságot” képviselnek. Például az angolban a "t" hangot többféleképpen lehet kiejteni, de az angolul beszélő személy minden esetben "t"-ként fogja fel. A lényeg, hogy a fonéma betöltse fő – jelentésmegkülönböztető – funkcióját. Ezen túlmenően a nyelvek közötti különbségek olyanok, hogy az egyik hang változatai egy nyelven különböző fonémáknak felelhetnek meg egy másikban; például az „l” és az „r” különbözik az angolban, míg más nyelveken ugyanannak a fonémának a változatai (mint például az angol „t”, aspirated vagy unaspirated kiejtése). Bármely természetes nyelv hatalmas szókincse sokkal kisebb számú fonéma kombinációinak gyűjteménye. Az angolban például csak 40 fonémát használnak körülbelül egymillió szó kiejtésére és írására.



Előző cikk: Következő cikk:

© 2015 .
Az oldalról | Kapcsolatok
| Oldaltérkép