Állandóság és változás a beszédben*

Oldalak: 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Állandóság és változás a beszédben*

1. Kiindulás. — Minden, ami él, az változik, de ebben a változásban mindig fellelhető az állandóság is. Úgy is fogalmazhatunk, hogy csak az élő, amiben vagy akiben az állandóság és a folyamatos változás egysége fellelhető. Egy dél-karolinai hegyvidéki közmondás szerint: „Nem vagyunk azok, akikké lenni akarunk, nem vagyunk azok, akikké leszünk, de azok sem vagyunk, akik voltunk.” Ez a közmondás ugyan az emberre vonatkozik, de vonatkozhatna akár a nyelvre, a beszédre is, hiszen a nyelvet használók révén a nyelv és annak hangzó formája is folyamatosan módosul, változik megtartva annak alapvető állandó jegyeit. Az a nyelv, amelyet nem beszélnek, nem használnak, megmerevedik, nem változik, „állandóvá” válik. Ez a nyelv azonban halálra van ítélve.

A nyelv változásáról rendszerint történeti megközelítésben folynak az elemzések, bár a naiv nyelvhasználó számára is nyilvánvaló, hogy a nyelv a jelenben, napjainkban is változik. Ezeknek a változásoknak a felismerése és a folyamatuk megismerése azonban másféle nehézségeket jelent a kutató számára, mint azok, amelyekkel a nyelvtörténész találja szembe magát (vö. Kiss Jenő, Gondolatok a nyelvi újításról. In: Ember és nyelv. Tanulmánykötet Keszler Borbála tiszteletére. Szerk. Kugler Nóra, Lengyel Klára. ELTE BTK, Bp., 1999. 188—92). Csupán néhány az alapvető kérdések közül. Azonosak, hasonlóak avagy egészen különbözőek a nyelvi változások diakrón és szinkrón megközelítésben? A nyelvtörténetben alkalmazott módszerek alkalmasak-e a jelen nyelvállapot változásainak (vagy állandó tényezőinek) definiálására és leírására? A nyelv hangzó formájának, a beszédnek a változásai miként függenek össze a ’nyelv’ változásaival?

E tanulmánynak nem célja ezeknek és a hasonló kérdéseknek a megválaszolása. A bemutatandó tényekkel, folyamatokkal, elemzésekkel, hipotézisekkel és magyarázatokkal azonban igyekszik kijelölni azokat az utakat, amelyeket rendszeresen bejárva, választ remélhetünk a szinkrón változás és az állandóság kérdéseire. A jelen munka célja a változás és állandóság viszonyának, e viszony paradoxonának és e paradoxon feloldhatóságának az elemzése a napjainkban hangzó beszéd teljes folyamatának vizsgálatával. Tárgyaljuk a beszédprodukció és a beszédmegértés különböző részfolyamatait, valamint az ún. átviteli közeget (amelyben a beszédjelet tartalmazó akusztikai rezgéssorozat továbbítódik).

2. Állandóság és változás a beszédprodukcióban. — A beszélő személyt tekintve a legszembetűnőbb változások az életkor előrehaladtával tapasztalhatók. Nyilvánvalóak a különbségek a gyermek és a felnőtt ejtése között, amelyek részben fiziológiás okokra, részben az artikulációs gesztusok összerendezettségének fejlődésére vezethetők [1] vissza. Már egyetlen szó ejtésében is óriási különbségeket tapasztalunk, ha összevetjük a gyermek és a felnőtt artikulációjáról készült hangszínképeket (1. ábra). A hangzás egyértelmű különbsége ellenére azonban a szó (az ábrán a csizma) mégis azonosítható, érthető marad, vagyis a konstans tényezők jelentősebbek az eltéréseknél. Az ábrán szereplő két ejtésről készült hangszínképek a teljes frekvenciatartományban eltéréseket mutatnak, ha azonban az egyes beszédhangokra jellemző akusztikai adatokat vetjük össze, már jóval nagyobb mértékű hasonlóságokat, illetőleg azonosságokat látunk. Az [i] magánhangzóra kapott első két formáns értéke a hároméves kisfiú ejtésében 400 Hz és 2700 Hz, a felnőtt férfi ejtésében pedig 300 Hz és 2400 Hz. A szóvégi [j] magánhangzó formánsértékei a gyermeknél 650 Hz és 1200 Hz, a felnőtt ejtésében pedig 580 Hz és 980 Hz. Ha a formánsértékek egymáshoz való viszonyát is elemezzük, a hasonlóság még nagyobb, vagyis az ún. invariáns tényezők — amelyek az észlelést és a megértést biztosítják — egyértelműen kimutathatók.

1. ábra

Hároméves gyermek (bal oldal) és felnőtt férfi (jobb oldal) ejtéséről készült hangszínkép (a csizma szóról)

Az anyanyelv-elsajátítás befejeződésével hosszú évtizedeken át az artikulációs mozgások állandósulni látszanak. A felnőttek artikulációs mozgásaiban (ugyanazon személy esetében) lényeges eltéréseket általában nem tapasztalunk. A beszédprodukció — a hangzás alapján — látszólag változatlan. A kísérleti adatok azonban arra utalnak, hogy a kommunikációnkban domináló beszédmegértés elfedi az időben lassan változó artikulációs különbségek akusztikai következményeit. Ez azt jelenti, hogy hosszú éveken át nem „halljuk” a beszéd hangzásának módosulását, változását sem ugyanazon beszélő, sem mások ejtésében. Ennek hasonló okai vannak, mint a gyermek és a felnőtt ejtésében szemléltetett változás és állandóság egysége. Noha a felsőbb frekvenciatartomány bizonyos elemei egyértelműen különböznek az évtizedek elteltével, csökken az elemek intenzitása; a beszédhangokra, azok kapcsolataira jellemző akusztikai szerkezet azonban változatlan (vö. részletesebben Gósy Mária, A beszéd akusztikai szerkezetének állandóságáról. In: Nyelv, nyelvész, társadalom. Emlékkönyv Szépe György 65. születésnapjára barátaitól, kollégáitól, tanítványaitól. II. Keraban Könyvkiadó, JPTE, Pécs, 1996. 66—75). [2]

A fiatal, illetve középkorú felnőtt és az idős ember hangja, beszéde azonban általában elkülöníthető; sőt az életkor is többé-kevésbé jól megítélhető. A beszélőszervek, valamint az ember teljes fizikai, fiziológiai és egészségi állapota hatással van a beszéd hangzására (Balázs Boglárka, Az időskori hangképzés jellemzői. In: Beszédkutatás ’93. Szerk. Gósy Mária, Siptár Péter. MTA Nyelvtudományi Intézete, Bp., 1993. 156—66). A változások a korábbiaknál erőteljesebben érintik a felső frekvenciatartományt, csökken a hangokat felépítő elemek száma, az intenzitás; de jellegzetesek a különbségek az alsó frekvenciatartományban is. A megváltozott fiziológiai állapot következményeként módosulnak az artikulációs mozgások, a bizonytalanabb ejtés pedig ismét sajátos akusztikai következménnyel jár (2. ábra). Mindeme változásokat növelik a prozódiai eltérések: a beszédtempó jellegzetes lassulása, az alaphangmagasság értékének csökkenése nőknél, magasodása férfiaknál, valamint a szünetek számának növekedése, tartamának hosszabbodása. Közel negyven év elteltével vizsgáltuk két színész beszédét. Azt találtuk, hogy a beszédük sebessége 12—20 szóval lett lassabb percenként, a férfi alaphangmagassága átlagosan 15 Hz-cel nőtt, míg a nőé több mint 100 Hz-et csökkent, és időskorukban ötször-nyolcszor annyi szünetet tartottak, mint fiatalon. Kétséget kizáró tény ugyanakkor, hogy az idős ember beszéde jól érthető, az egyes hangsorok, szavak azonosítása a hallgatónak semmiféle nehézséget nem jelent. A változások tehát bármennyire is szembetűnőek, a beszédhangok jellegzetes elemei oly mértékben állandóak maradnak, hogy ezek a mért értékek alig térnek el a fiatal beszélő azonos közlésének adataitól.

2. ábra

Fiatal felnőtt (bal oldal) és idős ember (jobb oldal) ejtéséről („...kapcsolatos ügyes-bajos dolgokat...”) készült hangszínkép

A továbbiakban az általános tendenciájú, viszonylag gyakori, illetőleg ismétlődő artikulációs sajátosságokat tekintjük át.

Ma már nem szükséges fonetikusnak lenni ahhoz, hogy megállapítsuk: az emberek beszédtempója gyorsult (vö. Gósy Mária, A magyar beszéd tempója és a beszédmegértés: Nyr. 1997: 129—39). A szemléletesség kedvéért a percenként ejtett szavak számával jellemezzük a több mint száz év alatt bekövetkezett változást (természetesen a régebbi korok adatai becsült értékek). 1869-ben mintegy 26 szót ejtettek egy perc alatt, 1889-ben [3] már 44-et, az 1960-as években több mint 50-et, napjainkban pedig a 60 szót is meghalad(hat)juk. Természetesen minden korban voltak, ma is vannak lassabban, közepesen és gyorsabban beszélők. A beszédtempó változik az életkorral, a beszélő lakhelye szerint (pl. falu vagy város), sőt számos további tényező (pl. szex, iskolázottság, foglalkozás, beosztás, szociális helyzet) is módosíthatja az adott beszédsebességet. Mindez azonban nem változtat azon a tényen, hogy a hangzó beszéd tempója szerte a világon gyorsuló tendenciát mutat. A dél-tengeri szigeteken több mint harminc évvel ezelőtt csupán 20 szót (!) ejtettek percenként (Mario Pei, Szabálytalan nyelvtörténet. Gondolat, Bp., 1966.); feltételezhető, hogy azóta ez az érték is megnövekedett...

Milyen változásokat eredményez a gyorsulás a beszédben? Jól észlelhetően rövidül a beszédhangok időtartama, különösen érinti ez a nyelvileg hosszú magán- és mássalhangzókat. A magánhangzók rövidülése részben együtt jár jellegzetes hangminőségük „elvesztésével”, a beszédhang semlegessé válásával (Gósy Mária, A magánhangzók minőségváltozásai a spontán beszédben: Nyr. 1997: 45—56). A rövidülést adott helyzetben a törlődés, vagyis a beszédhang(ok) kiesése követi. Jellegzetes koartikulációs folyamatok mennek végbe, elsősorban hasonulások, amelyek azonban nem nyelvspecifikusak. A beszédsebesség gyorsulása mintegy kényszeríti a beszélőt az artikulációs gazdaságosság feltétlen betartására. A felsorolt változások érvényesülését az adott fonetikai kontextus és az érthetőség kritériuma korlátozza (korlátozhatja).

A spontán beszédben jóval nagyobb mértékben tapasztalható az artikulációs gesztusok pontatlanabb megvalósítása, mint például olvasáskor. Ez egyértelműen a beszédtervezési sajátosságok következménye, másfelől azonban alkalmat ad a beszéd módosulásainak, változásainak kialakulásához. A spontán beszédben még az akaratlagosan aligha tervezhető artikulációs részmozzanatok is különbséget mutatnak például az izolált ejtéshez képest. A zöngekezdési idő (VOT) például meghatározó a zöngétlen felpattanó zármássalhangzók képzéshely szerinti megkülönböztetésében. Nők és férfiak szóejtésében és spontán beszédében elemeztük a zöngekezdési idő értékeit. A VOT értékei szignifikánsan különböztek spontán beszédben és szóejtéskor (1. táblázat).

1. táblázat

Zárhangok	A zöngekezdési idő értékei (ms)
p t k	átlag		szórás
	spontán beszéd	szavak	spontán beszéd	szavak
	18,51	24,64	09,1—28,8	13,2—34,8
	26,59	23,30	14,3—38,4	15,4—37,6
	35,31	50,17	22,2—68,6	32,6—65,8

A zöngekezdési idő változása izolált ejtésben és spontán beszédben

A változás szembetűnő és jellegzetes. Az átfedések és a szórás ellenére állandó mégis az eltérő képzéshelyű zármássalhangzók zöngekezdési idejének egymáshoz viszonyított aránya. Ezek az értékek nagymértékben nyelvspecifikusak, a magyar ejtésben mért értékek 17 vizsgált nyelv közül mindössze eggyel, a yapese nyelv adataival mutatnak hasonlóságot.

Az érzelmek közismerten hatással vannak a beszéd hangzására nemcsak az előadói, színpadi beszédben, de a mindennapi kommunikációban is. A fonetikai elemzések kétséget kizáróan igazolták, hogy — nyelvtől függetlenül — a prozódiai sajátságok jelentősebbek [4] az érzelmek kifejezése szempontjából, mint a szegmentális szerkezet. Elsősorban az alaphangmagasság változása, módosulása a meghatározó, de hasonlóképpen fontosak a többi szupraszegmentális tényezők, így a tempó, az intenzitás, a szünetstruktúra és a ritmus. Bizonyos érzelmek következtében változik az artikulációs pontosság is, főként a magánhangzókat illetően. A percepciós kísérletek eredményei szerint a hallgatók az érzelemmentességet, valamint az örömöt (boldogságot) és a bánatot (szomorúságot) ismerik fel a legbiztosabban.

Az alkoholnak a beszédre gyakorolt hatása nemcsak a kísérleti fonetika szempontjából érdekes, az alkalmazott fonetikának a beszéd- és beszélőazonosítással foglalkozó területei nem nélkülözhetik ezeket az ismereteket. A kísérletek eredményei szerint a 0,03% és 0,08% közötti alkoholszintnek nincs hatása a beszéd hangzására. A 0,08% fölötti értékek azonban elsősorban a beszéd szupraszegmentális szerveződését, majd pedig fokozatosan a szegmentális megvalósítást is befolyásolják (Künzel, H. J.—Braun, A.—Eysholdt, V., Einfluss von Alkohol auf Sprache und Stimme. Kriminalistik-Verlag, Heidelberg, 1992.). A változások a következőkben foglalhatók össze: emelkedik az alaphangmagasság értéke, csökken a beszéd tempója, gyakoribbá és hosszabbakká válnak a szünetek, ugyanakkor növekszik a beszéd hangossága és fokozatosan elnagyoltabbá válnak az artikulációs mozgások, egybemosódnak a szóhatárok. Bár a felsoroltak — úgy tűnik — nyelvtől független jelenségek, azonban nem függetlenek az adott beszélőtől. Az alkoholos állapot egyes szintjei nem egyformán hatnak az egyes személyek beszédére. Újabban akusztikai-fonetikai szempontból is vizsgálják a dohányzás hatását a beszédre. Az eredmények szerint (25 éve dohányzó tanárnők és nem dohányzó kollégáik beszédének elemzése alapján) a sok éven át tartó dohányzás a hangszalagok oly mértékű fiziológiai változásához vezet, hogy a két kísérleti csoport alaphangmagasságának átlaga közel 40 Hz különbséget mutatott. A nem dohányzó tanárnők alaphangja átlagosan 191 Hz, míg a dohányosoké 152 Hz volt (Hedever, M.—Kovačič, G.—Barišić, V., Utjecaj pušenja i radnog staža na osnovni laringalni ton nastavnica: Govor XVI. 1999: 33—45).

A hangszalagok bénulása, működésképtelensége a zönge (részleges vagy teljes) elvesztéséhez vezet. Azok a betegek, akiknek műtéti úton eltávolítják a gégéjüket (laryngectomia), a megszokott módon többé nem tudnak beszélni. Kétharmaduk azonban képes megtanulni a nyelőcsőbeszédet (ún. özofágusz beszéd). Az özofágusz beszéd az ún. póthangrésen formálódott nyelőcsőhang artikulációjával jön létre (vö. Gósy Mária, Pszicholingvisztika. Corvina, Bp., 1999.). Nyilvánvaló, hogy így a megszokottól lényegesen eltérő hangzású beszéd keletkezik. A funkcióját azonban teljesíti, ez pedig az állandó paraméterek megőrződésének köszönhető. A nyelőcsőbeszédből hiányzik a zönge; a „zöngés” beszédhangok periodikussága erősen változó, a beszédet a súrlódásból adódó zörejelemek tarkítják; a tempó rendszerint lassú, gyakoriak a szünetek. A jól beszélő laryngectomizált beteg artikulációjának következtében ugyanakkor az invariáns elemek kétséget kizáróan azonosíthatók: a magánhangzók első és második formánsai (bár intenzitásuk erősen változó), a zörejes mássalhangzókra jellemző intenzív gócok a normál ejtésnek megfelelő frekvenciasávban jelennek meg. Bár az így beszélőket néha nem könnyű megérteni, az adott kontextus és a beszédhelyzet — mint szintén invariáns tényezők — tökéletesen biztosíthatják a megértést.

Számtalanszor fordulnak elő beszédünkben nyelvbotlások, vagyis olyan, elsősorban a szegmentális szerkezetet érintő tévesztések, amelyek a beszélő szándéka ellenére jönnek létre. A nyelvbotlásoknak különféle típusai vannak, amelyek jól szemléltetik a spontán beszédet létrehozó, illetőleg azt megelőző beszédprodukciós folyamatokat (Gósy i. m. 1999.). Az artikulációs mozgások szintjén jelentkező nyelvbotlások az önkéntelen artikulációs gazdaságosságra törekvés következményei. Nemegyszer nem egyetlen szón [5] belül érvényesülnek, hanem a fonetikai kontextus hatására jönnek létre. Ezeket a nyelvbotlásokat a beszélők többször nem javítják, mint javítják, néhányukról nincs is tudomásuk. Példák: „Megköszönöm az érdeklédésüket...” vagy „Lekatar...letakarta a papagájt” vagy „az ors...országos választmány” ... ” vagy „a huradó” (’híradó’). A kontextushatás következtében létrejövő tévesztéseket általában egy szomszédos szó eredményezi. Példák: „Hacsek és hajó...” vagy „transzformációs, generációs grammatika”. A nyelvbotlások tanulmányozása a hallgató szempontjából is fontos, mivel rávilágít azokra a predikciós és újraelemző, újraértelmező folyamatokra, amelyek az elhangzó beszéd feldolgozása közben történnek, és biztosítják az észlelést és a megértést a beszélő esetleges hibázásai esetén is. Éppen ezeknek az előjelző és korrigáló működéseknek az eredménye az, hogy a nyelvbotlások egy részét a hallgató észre sem veszi. A beszédfeldolgozás e működéseinek és stratégiáinak jelentős a szerepe a beszéd hangzásának változásaiban.

3. Az átviteli közeg szerepe a beszéd állandóságában és változásában. — A mindennapi kommunikáció legnagyobb része (háttér)zajban történik. A jelátvitel szempontjából nem lényegtelen, hogy ez a háttérzaj milyen frekvenciákon jelentkezik, milyen az időszerkezete, a minősége és mekkora az intenzitása, azaz az erőssége. Mind a beszédprodukció, mind a beszédmegértés szempontjából döntő azonban az, hogy a zajnak hatása van a beszédfolyamatok működésére.

A kísérleti eredmények igazolták, hogy — zaj hatására — a beszédprodukció során gyorsul a tempó, emelkedik az alaphangmagasság, ugyanakkor a modulációja csökken, vagyis a dallam monotonná válik. Növekszik az intenzitás, azaz a beszélő a zaj típusától és erősségétől függően egyre hangosabban beszél (erről legtöbbször nincs is tudomása). A beszédet különféle tévesztések „tarkítják”, megnövekszik a nyelvbotlások száma, jellegzetes ejtéshibákat tapasztalunk (pl. hanghelyettesítések, metatézisek, hang/ok/ kiesése, pongyola hangképzés, magánhangzók redukált ejtése). Gyakoriakká válnak a hangsúly- és a ritmushibák. Jellegzetes továbbá a beszédet kísérő furcsa mimika, a funkciótlan fejmozgás, izzadás, gyakori torokköszörülés, ritkábban a kézremegés is.

A beszédmegértésben az észlelési szintek működése bizonytalanná válik, így a félreértéseknek és a téves dekódolásnak nagy a lehetősége. A kísérletek szerint — a zaj típusától, intenzitásától, valamint az elhangzó beszéd információsűrűségétől függően — a hallottak 30—50%-a is elveszhet, vagyis a megértés erősen sérül (Gósy Mária, Psychoacoustic consequences of noises for communication. In: Proc. of the 5^th International Congress on Noise as a Public Health Problem. Stockholm, 1988. 235—40). A tapasztalatok azt mutatják, hogy a gyermekek anyanyelv-elsajátítására fokozott, nemkívánatos hatást gyakorol a környezeti zaj. Az ebben felnövekvő gyermekeknél szignifikánsan nagyobb arányban fordulnak elő a beszédhibák, a gyermekkori diszfónia, valamint a beszédészlelési és beszédmegértési zavarok.

Csendes körülmények között, optimális átviteli közeget feltételezve a beszéd akusztikailag mintegy 8000 Hz-es tartományban valósul meg. A fentiekben említett zajos háttér következtében, a hallgató szempontjából ez a legmegfelelőbb frekvenciatartomány ritkán áll rendelkezésre, a beszéd több-kevesebb torzítással jut el a feldolgozó mechanizmushoz. Meglehetősen nagyfokú a „torzulás” a beszéd akusztikai szerkezetét tekintve, ha az átviteli közeg a telefonvonal. Ebben az esetben ugyanis a hasznos akusztikai-fonetikai információt tartalmazó frekvenciatartománynak több mint 50%-a vész el. A telefonvonal átvitele mintegy 3500 Hz-es sávszélesség, ami azt jelenti, hogy a beszéd jellegzetes invariáns elemei megjelen(het)nek, azonban az észlelést és a megértést jól biz-tosító többletinformációk feldolgozására nincs lehetőség. A 3. ábra a telefonvonalon átjuttatott mondat akusztikai szerkezetét mutatja. Ez az erősen „szűkített” átviteli közeg [6] nyújtja a magyarázatot arra, hogy bár a kommunikációnk tökéletes is lehet telefonon keresztül, vagyis megértjük egymást, az észlelésünk azonban rendkívül bizonytalan. Gondoljunk csak arra, hogy például nevet milyen nehéz a telefonban pontosan azonosítani.

3. ábra

Telefonon át rögzített beszéd hangszínképe (mintegy 3500 Hz-től hiányoznak a jelek)

4. Állandóság és változás a beszédészlelésben és a beszédmegértésben. — A beszédtempó magától értetődően befolyásolja az elhangzó beszéd észlelési és megértési biztonságát. Általánosságban kimondható, hogy minél gyorsabb a beszéd sebessége, annál nagyobb az észlelési és megértési problémák kialakulásának a lehetősége. A beszédprodukció és a beszédfeldolgozás összhangját ugyanakkor jól mutatja, hogy képesek vagyunk gyorsabb beszéd megértésére, mint a magunk által létrehozott leggyorsabb artikuláció (vö. Gósy Mária, Beszédészlelés. MTA Nyelvtudományi Intézete, Bp., 1989.). Ez azt jelenti, hogy az ember sohasem tud olyan gyorsan beszélni, hogy azt a hallgató — kizárólag az elhangzási sebesség miatt — ne értse meg. Ez a fiziológiai biztosítéka a kommunikáció sikeres megtörténtének.

A beszédfeldolgozás során a kontextushatás ellensúlyozhatja a gyorsabb beszédtempót. Ennek a következménye az, hogy minél hosszabb az elhangzó közlés, általában annál biztosabb a megértés. A közepes és gyors tempóban közölt szókapcsolatok pontos felismerése 10—20%-kal, az izolált szavaké 40—60%-kal is csökkenhet felnőtt kísérleti személyek esetében. Még nagyobbak a percepciós nehézségek a gyermekek beszédfeldolgozásában; gyors tempó esetén a 6 éves óvodások gyakorlatilag nem ismerik fel az elhangzottakat.

A beszédhangok, hangsorok artikulációs gesztusai több-kevesebb különbséggel avagy azonossággal realizálódnak a mindenkori beszéd során. Miként határozható meg ebben az állandóság, avagy mit tekinthetünk változásnak? Több nyelv magánhangzóira meghatározták a koartikulációs mezőt, vagyis akusztikailag azt a területet, amelyet az adott beszédhang első és második formánsának értékei meghatároznak (behatárolnak) a különböző fonetikai kontextusokban. A magyar [u:] magánhangzóra kapott határértékek a következők: F1 = 250—430 Hz, F2 = 610—830 Hz. Az ezen határokon belül jellemzett [7] F1/F2-értékek egyértelműen meghatározzák az [u:] magánhangzót, vagyis biztosítják az akusztikai állandóságot. Az ezen értékeken kívül eső F1/F2-konfiguráció nem a magyar [u:]-ra jellemző, tehát ismét biztosíték az állandóságra. S mi akkor a változás? Az a sokféle F1/F2-adatpár, amelyek — bár értékben különböznek egymástól — mégis valamennyien a felső nyelvállású, hátul képzett, labiális, hosszú magánhangzónk azonosítására szolgálnak. Valamennyi beszédhangunkra meghatározhatók ezek az állandó értékek, amelyeket akusztikai invariáns jegyeknek nevezünk, s elsődlegesek a beszéd mindenkori észlelésében.

A beszédtempó gyorsulásának tárgyalásakor említettük a magánhangzók rövidülési tendenciáját a sebesség növekedésének hatására, amely számos fonetikai helyzetben az ún. semleges magánhangzók (svak) létrejöttéhez is vezet. A beszédpercepciós kísérletek megerősítették ezeknek a semleges hangminőségeknek a jelenlétét a spontán beszédben; előfordulási arányuk azonban a feltételezettnél jóval nagyobbnak bizonyult (Gósy Mária i. m. 1997.). Ha csupán a gyakori [a:, , o, e] magánhangzókat tekintjük, azt tapasztaljuk, hogy a kísérleti személyek az eredeti hangminőséget átlagosan 50,6%-ban ismerték fel, míg semleges hangot azonosítottak 49,3%-ban. Anyagunkban legnagyobb mértékben az [e] jelentkezett svaként (57,4%-ban), legkisebb mértékben az [o] (32,5%-ban). Ez a semlegesítődési folyamat a hangsúlyos helyzetű beszédhangokat is érinti.

A mindennapi kommunikáció egy része a beszélő/hallgató egyéb cselekvései következtében nem tökéletes körülmények között megy végbe. Evés közben beszélünk és hallgatjuk mások beszédét, vagyis észlelünk és megértünk. Természetes, hogy az artikuláció bizonyos fokig érintett, de különösen a beszédfeldolgozás tekintetében tapasztalunk változásokat. Kísérletsorozatban vizsgáltuk meg azt, hogy vajon evés közben változik-e a hallásunk, az észlelésünk és a megértésünk; s ha igen, milyen mértékű ez a feltételezett eltérés. A kísérleti személyek először tejbegrízt, majd zöld almát ettek, miközben klinikai audiométerrel mértük a hallásukban bekövetkező változást, valamint tesztekkel vizsgáltuk a beszédészlelésük és a mondatértésük alakulását (4. ábra).

4. ábra

Tejbegríz (fekete oszlopok) és zöld alma (fehér oszlopok) evésekor mért változások a hallásban, a beszédészlelésben és a megértésben

A mindennapi tapasztalatunkat — azt, hogy evés közben mintha nem jól „hallanánk”: felhangosítjuk a rádiót, a televíziót, illetőleg nehezebben értjük az ismert idegen [8] nyelvet — az eredményeink alátámasztották. A résztvevők hallása a tejbegríz hatására csak igen kis mértékben változott, a zöld alma evésekor azonban jelentősen csökkent, átlagosan 25 dB-nyit. Drámai mértékben változott a kísérleti személyek beszédészlelése, a zöld alma evésekor gyakorlatilag nem tudták a közölt szavakat azonosítani. A mondatértés biztonsága is csökkent, mintegy húsz százalékkal romlott a pontos dekódolás. A kérdés az, hogy vajon mi okozta a kísérleti személyek beszédfeldolgozásában tapasztalt változásokat. Az evés következtében létrejövő zaj (a kísérletben különösen a zöld alma esetében), valamint a rágás fiziológiai következményei feltehetően együttesen eredményezik a hallás és a beszédfeldolgozás átmeneti változásait.

A beszédprodukció pillanatnyi változásainak, a nyelvbotlásoknak a beszédfeldolgozás folyamatában a félrehallások, félreértések „felelnek meg”. Ezek a hallgató szándékától függetlenül létrejövő jelenségek a beszédészlelési, beszédmegértési mechanizmus sajátosságai. A félreértések leggyakrabban három okra vezethetők vissza: az adott beszédhang vagy beszédhangok téves észlelésére, a hibás szegmentálásra, valamint a téves predikcióra (ezek együttesen is felléphetnek). A nyelvbotlásokhoz hasonlóan többségük észrevétlen marad, illetőleg a korrekció olyan gyors és kézenfekvő, hogy a hallgató nincs tudatában az elvégzett javító műveleteknek. Ha a korrekciós folyamat hosszabb időt vesz igénybe, vagy az elhangzott közlés pillanatnyi megértési nehézséghez vezet, akkor a félreértés ténye nyilvánvalóvá válik, s a hallgató igyekszik, most már szándékosan javítani. Példák a téves beszédhang-észlelésre: az eredeti közlés az volt, hogy „ne menj a házához”, a félreértett változat pedig az, hogy „ne menj a vázához” vagy az eredeti közlés: „Jó ez az illat.”, a félreértett változat pedig: „Jó ez az élet.” A téves szegmentálás eredményezte az eredeti „Tegnap óta itt áll?” mondat „Tegnap óta ittál?” változatát, vagy az eredeti közlés az volt, hogy „Nézd, leszedték az árakat!”, amit a hallgató úgy azonosított, hogy „Nézd, leszedték a zárakat!”. Több ok egyidejű hatására jött létre a „két ember hazudik” eredeti közlés „képembe hazudik” azonosítása vagy a „kérlek, negyedeld!” felszólítás „kérlek, ne egyed!” közlésként történő felismerése.

A téves észlelés és a mindenkori humán beszédmegértési „kényszer” feloldása gyakorta az, hogy a hallgató a mentális lexikonából egy „kézenfekvő” szót aktivál, amely mintegy helyettesíti az eredeti hangsort. Ez egyfajta értelmezés, az aktivált szó szinte minden egyes esetben másként magyarázható. A „nem érthető” érthetővé tételének jól ismert folyamata az ún. népetimológia. Legismertebb példái a peronoszpóra ’fene rossz póra’ értelmezése avagy a tuberosa ’tubarózsa’ alakítása. Hasonló elv alapján hozták létre a nyelvújításkor a Koppenhága helyett a Kappanhágó vagy a Stockholm helyett az Istókhalma neveket (nem terjedtek el). Ösztönösen ugyanezt a stratégiát követi a kisgyermek, amikor az anyanyelv-elsajátítás során értelmezi a hallottakat, például müezzin helyett mű-szellem-et vagy a számára ismeretlen cserge helyett a számára ismert zergé-t alkalmazza. A népetimológia a mindennapokban is jelen van, ha figyelünk rá. Egy idős hölgy — mentális lexikonának teljes jogú tagjaként — használta a nőgrófterápia szót ’mammográfia’ jelentésben. Egy gyógyszerész közölte velem az alábbiakat, amelyeket a betegek használtak egy-egy latin nevű orvosság azonosítására: szuper panzió terpentin ’suspenzio terpin hydrat’, fene buzeron ’phenilbutazon’, síró lúd ’sirdalud’ és esti tulok ’estulic’. Több orvossal és gyógyszerésszel tesztelvén a fenti kifejezéseket, mindenki kivétel nélkül felismerte, hogy melyik gyógyszerről van szó. Az a stratégia tehát, amelyik létrehozta ezeket a formákat, az azonos nyelvközösség tagjai számára megfejthető, egyértelmű.

5. Változások a beszédben (szegmentális és szupraszegmentális szinten). — A beszéd az időtengely minden lehetséges pontján módosul, változik. Ezek a változások azonban bizonytalanul érzékelhetők a jelenben; felismerésük kétséges, lefolyásuk [9] rendszerint hosszabb időt vesz igénybe, elterjedtségük megítélése erősen szubjektív, ezért a pillanatnyi állapot elemzése az esetleges változás vagy állandóság szempontjából nem könnyű. A beszéd két nagy folyamatrendszerében tapasztalható változások és állandó jegyek tárgyalása után most összegezzük azokat a lehetséges okokat, amelyek a szegmentális és szupraszegmentális szintű változásokhoz vezetnek.

1. Ejtési gazdaságosság. Más megfogalmazásban: egyszerűsítési szándék, függetlenül attól, hogy egy adott beszédhelyzetben milyen tényezők indukálták a törekvést és eredményezték a megvalósítást. A változásban azonban mindig jelen kell, hogy legyen az artikulációs gazdaságosság és az érthetőség egysége.

2. A beszédtempó gyorsulása. A beszéd sebességének a változása összefügg az ejtési gazdaságosság tényével, illetőleg az egyszerűsítési szándékkal.

3. Az átviteli közeg hatása. Minden kommunikáció valamiféle közegben zajlik, amelynek átviteli paraméterei meghatározóak a beszédészlelés és a beszédmegértés számára; ezen a módon pedig a közeg maga a legkülönfélébb változások okozója, forrása lehet.

4. Környezeti tényezők. Más szavakkal: a mindenkori beszédhelyzet; számos összetevője van, amelyek külön-külön vagy akár együttesen is kiválthatnak módosulást, változást. Ilyen például az írás (írott nyelv) hatása a beszédre, például a hiperkorrekt ejtés esete. Idesorolandó a régi írógépek klaviatúrájának esetleges hatása (az í, ú, ű betűk hiánya, vö. már az egri kiejtési konferencia kötetében: Helyes kiejtés, szép magyar beszéd. Szerk. Grétsy László, Szathmári István. Tankönyvkiadó, Bp., 1967.) Itt kell megemlítenünk a divat tényezőjét és a szógyakoriságot is. Utóbbiról kísérletekkel igazolták, hogy másképpen ejti a beszélő a gyakrabban használt szavakat, mint a ritkábbakat (kétségkívül másként is észleli azokat). Noha objektíven nehezen igazolható, a módszertani hátrány nem kérdőjelezheti meg a napi beszédélmény ejtésmódosító hatását, amelynek tényével ugyancsak számolnunk kell.

5. Érzelmi magatartás („felfokozott idegállapot”). Láttuk, hogy az érzelmek változásokat idéznek elő az artikulációban, s ezek a változások nyomot hagy(hat)nak a kommunikáció minden résztvevőjében.

Elemzéseink szerint a hangváltozások valamennyi feltételezett oka (függetlenül attól, hogy történeti vagy leíró szempontból vizsgálódunk) a fenti öt kategória valamelyikébe besorolható, illetőleg azon belül tárgyalható. Hangsúlyozzuk azonban, hogy valamennyi tényező a beszédészlelés folyamatában fog vagy nem fog érvényesülni. Ez azt jelenti, hogy a hangváltozások csak akkor mennek valóban végbe, ha a „nélkülözhetetlen partner”, a hallgató beszédfeldolgozásán keresztüljutnak. Itt dől ugyanis el, hogy például egy produkciós jelenség változás lesz-e avagy megmarad a nyelvbotlás elszigetelt szintjén. Másfelől, ugyancsak a beszédészlelési, megértési folyamat eredményeképpen válhat egy produkciós nyelvbotlás a változási folyamat kiindulásává.

Lássuk a köznyelvi mert ® mer napjainkban tapasztalható hangváltozás példáját (ti. a kötőszó szóvégi zárhangjának lekopásával létrejött alternatív hangzásforma) a fenti osztályozás lehetséges okai szerint! A [t] mássalhangzó törlődhet az ejtési gazdaságosság okánál fogva, hiszen a szó — nagy gyakoriságát is tekintetbe véve — csonkult formájában is érthető marad. Az érthetőség kritériumának biztosításához az is hozzájárul, hogy nincs a nyelvben más jelentéssel bíró mer hangsor. Példák: mert rohannak ® merrohannak, mert csináltuk ® mercsináltuk, mer[d] beszéltek ® merbeszéltek. A zárhang törlődését a gyors ejtés is előidézheti (ez ismételten összefügg az egyszerűsítésre törekvéssel), például: mert senki se ® mersenkise. Egyéni artikulációs gesztus, pillanatnyi „nyelvbotlás”, az adott beszédhelyzet kiváltó hatása avagy érzelmi állapot is eredményezheti a mer alak létrejöttét. A kötőszó csonkult formája megjelenhet a hallgató észlelésében, [10] dacára annak, hogy a beszélő a teljes, mert szót ejtette. Ha az átviteli közeg nem optimális (például zaj van), akkor az optimálisnak tekinthető ejtés ellenére is változás következik be: mert azok ® (észlelés) merazok. Megfelelő átviteli közegben is előfordulhat téves észlelés, amelynek eredményeképpen a hallgató nem észleli a szóhatáron a zármássalhangzót.

6. A beszéd változásainak folyamata. — A beszéd formai változásai közül a szegmentális szintűek (a hangváltozások) általában szembetűnőbbek, mint a szupraszegmentálisak. Létrejöttükben két szakaszt tételezhetünk fel a beszélő/hallgató viszonyában. Az első szakasz a hangváltozás megjelenése, a második a változás elfogadása és elterjedése. Az első szakasz szemléltetésére a -ban/-ben, -ba/-be ragpár használatát hozzuk példának. Közismert, hogy a spontán beszédben gyakran jelenik meg az illatívuszi rag az inesszívuszi toldalék helyén, még olyan beszélők ejtésében is, akik ezt a „helyettesítést” hibásnak minősítik (vö. Kontra Miklós, Gondolatok a (-bVn) és a (-bV) nyelvi változókról. In: Nyelvi változó — nyelvi változás. Szerk. Sándor Klára. JGYTF Kiadó, Szeged, 1998. 9—21). A beszélő — szándéka szerint — azt akarja mondani például, hogy A gyerek ma nem volt iskolában. A megvalósításban azonban az iskolában ragos főnév szóvégi nazális mássalhangzója törlődik, vagyis a beszélő ezt nem ejti, így létrejön az iskolába alak. A hallgató azonosítja ez utóbbi formát, a beszédfeldolgozás folyamán azonban korrigál, és az iskolába észlelés ellenére az iskolában szót fogja érteni. Ebben az első szakaszban tehát a későbbi hangváltozás lehetősége már adott; a példában az egyszerűsítésre törekvést tételezhetjük fel a beszélő oldaláról, amely a kontextushatás következtében a hallgatónak megértési nehézséget nem jelent.

A példaként hozott ragpár formájának alakulása történetileg is rendkívül érdekes. A XIV. században a hol? kérdésre felelő ragunk már megvolt, de a hova? kérdésre felelő még névutóként funkcionált. A század végére már kialakul a -ba/-be ragpárunk is, névutói funkciójának elvesztésével, vö. pl. JókK. 42: cellaba ’cellába’. Az inesszívuszi és az illatívuszi funkciók teljes formai elkülönülése azonban csak látszólagos. A -ban/-ben ragot a hol? kérdésre 77,71%-ban használják, míg 33,29%-ban az illatívuszi -ba/-be is betölti az inesszívuszi funkciót! Talán még meglepőbb, hogy a mai norma szempontjából hiperkorrekt -ban/-ben forma megjelenik illatívuszi funkcióban, ennek az aránya 25,94%, az elvárt alakok előfordulása ekkor 74,06% (vö. A magyar nyelv történeti nyelvtana. I., II/1. Akadémiai Kiadó, Bp., 1991. 1992. különösen II/1: 367, 397—8). A formai keveredésre további szórványos adatokat találunk. A XVIII. század végén — a hosszú szótagok elterjedésével egyidőben — meghosszabbodik a -ban/-ben ragpárunk nazális mássalhangzójának ejtése. Vértes O. András írja ugyanis (A magyar leíró hangtan története az újgrammatikusokig. Akadémiai Kiadó, Bp., 1980.), hogy Dayka Gábor, Batsányi és Verseghy is felemelték szavukat az igen hosszan ejtett -bann/-benn (!) ragok ellen (vélhetőleg az időmértékes verselés miatt). Napjainkban az alternatív formák — mind a kissé stigmatizált, mind a hiperkorrekt ejtésváltozat — előfordulnak, arányukról pontos adataink nincsenek. A tendencia a spontán közlésekben a -ba/-be formák elterjedését mutatja inesszívuszi funkcióban, míg az igényes beszédben egyre gyakrabban tapasztaljuk a hiperkorrekt változatot. Utóbbira példák: „...törekedett arra, hogy külföldi hírességeket hívjon ide, a stúdióban.”, vagy „...a Külügyminisztérium kötelékében tartozik”.

A hangváltozások második szakasza akkor következik be, amikor a hallgató a saját beszédprodukciójában a nem átalakított formát használja, vagyis átveszi és használni kezdi a hallott alakot (5. ábra). [11]

5. ábra

A hangváltozások második szakaszának sémája

A hangváltozások akkor válnak nyilvánvalóvá és elemezhetővé, ha mód nyílik a korábbi és az új forma összevetésére. Számos hangváltozás azonban nem jut el odáig, hogy elterjedjen, mert valamilyen (külső vagy belső) körülmény nem engedi vagy nem teszi lehetővé az elterjedését. Ha a hangváltozás már a második szakaszban van, azaz létrejött az „új” fonetikai forma, akkor következik a megítélés, amelynek eredményeképpen eldől, hogy valóban változás történik-e, avagy csupán szórványosan előforduló jelenségekkel állunk szemben. A megítélés lehet artikulációs, percepciós, szociális, társadalmi és/vagy rendszer szerinti (Lindblom, B., On phonetic variation. In: Evolution of spoken language. Szerk. Lindblom, B., MacNeilage, P., Studdert-Kennedy, M., Cambridge University Press, Cambridge, 1993.). Ha a megítélés pozitív, akkor az új formát a nyelvet beszélők közössége elfogadja: megtörtént a hangváltozás.

A hangváltozások megítélése, az elfogadás és elterjedés folyamata meglehetősen öntörvényű. Lotz János írja, hogy a Comédie Française színpadán megkövetelték a pergetett nyelvhegyi [r] ejtését, amikor már egész Párizs uvuláris [r]-t használt (Szonettkoszorú a nyelvről. Gondolat, Bp., 1976.). A változás nemigen állítható meg, és kevéssé befolyásolható tudatosan. Az elmúlt évtizedekben például több ízben felmerült a zárt [e] magánhangzónk megőrzési kísérlete. Bárczi Géza az 1965-ös kiejtési konferencián azt mondta, hogy e magánhangzónk elterjedéséhez 20—30 évre van szükség (i. m. 1967.). A beszéd változásainak behatóbb tanulmányozása alapján állíthatom, hogy a zárt [e] „felélesztési” kísérlete csak kudarchoz vezethet, mivel a fiatalabb generációk nem tudják azonosítani ezt a magánhangzót, s ha nem észlelik pontosan, és nem képesek más [e]-féle hangoktól megkülönböztetni, akkor ez kizárja az elterjedést.

A beszéddallam területén lehetünk tanúi egy olyan változásnak, amely a norma szerint ugyan nem elfogadható, mégis egyre nagyobb mértékben terjed. Mind a beszédprodukció, mind a beszédészlelés tekintetében bizonyítható a változás jelenléte. A kiegészítendő kérdő mondatok dallammenete a norma szerint a közlés elején frekvenciacsúccsal, majd ereszkedő hanglejtéssel jellemezhető. A mindennapi kommunikációban ez a kérdés azonban szólamvégi emelkedéssel zárul. Az észlelési kísérletsorozat eredményei is igazolták a változás tényét: sokkal hamarabb azonosítják a kísérleti személyek kérdésnek azokat a dallamokat, amelyek szólamvégi emelkedéssel zárulnak, mint azokat, amelyek [12] ereszkedőek (6. ábra). Ha a szólameleji csúcs értéke 270 Hz, akkor ereszkedő dallammenetnél alig 40%, emelkedő szólamvég esetében pedig több, mint 80% a kérdés azonosítása.

6. ábra

A kiegészítendő kérdés felismerése ereszkedő és emelkedő végű dallammenet esetén (a vízszintes tengelyen a szólameleji csúcs értéke látható Hz-ben)

Az elmondottak során mindig kitértünk a változás, módosulás tárgyalása mellett az állandó jegyek bemutatására is. Most összegezzük az ’állandó’ sajátosságait és megjelenési formáit.

1. Akusztikus invariancia. A beszédhangokban, a hangkapcsolatokban, a szótagokban megjelenő nyelvspecifikus állandó, amely az idő, a frekvencia és az intenzitás összefüggésrendszerében definiálható.

2. Invariancia a kontextusban. A szavak, mondatok, hosszabb közlések szemantikai és szerkezeti jellegzetességei számos különféle állandó jegyet tartalmaznak, amelyek akár mint elsődleges invariáns tényezők, akár mint redundáns jelenségek biztosítják az állandóságot.

3. Invariancia a beszédhelyzetben. Bizonyos esetekben a beszédszituáció átmenetileg biztosíthatja a közlések létrehozásának és feldolgozásának állandóságát, ha valamilyen oknál fogva az elsődleges invariáns jegyek bizonytalanok vagy teljesen nem felhasználhatók.

4. Az ismeret, a tudás mint állandó kapcsolat a beszélő és a hallgató között. A beszélő minden pillanatban megpróbál a hallgató elvárásainak megfelelően beszélni. Ez azt jelenti, hogy igyekszik biztosítani a közlései eljutását a hallgatóhoz, valamint szem előtt tartja a feldolgozhatóságukat. A hallgató feltételezett igényeinek megfelelően váltogatja az ismert és új információk közlését, és az azoknak mindig legmegfelelőbb forma megválasztására törekszik. A hallgató pedig igyekszik minden körülmények között a legjobbbeszédértési teljesítményre, a leggyorsabb asszociációs működésekre; „ráhangolódik” az elhangzott közlésekre. Mindez a közös nyelvi, kulturális, tárgyi (ismeret szintű) és egyéb kommunikációs tudás alapján történik. [13]

7. Záró gondolatok. — A változás és az állandóság a beszédben dinamikus egységben van. A változások csak úgy és annyira jöhetnek létre, hogy a beszéd funkciója ne sérüljön; az állandó jegyeknek pedig oly mértékben kell rugalmasaknak lenniük, hogy — bár paradoxonnak tűnhet — biztosítsák a változások kialakulásának lehetőségét, a változások terjedését és pozitív megítélés esetén a lefolyásukat.

Fogalmazhatunk úgy, hogy a szinkrón változások időbeli lefolyása olyan „lassú”, hogy ez okozza az állandóságról alkotott benyomásunkat. A beszédben bekövetkező változási tendenciákat sokkal jobban (és gyorsabban) érzékeljük a szókincs, illetőleg a szóhasználat területén, mint például a hangváltozások vagy a prozódiai módosulások tekintetében. Minden, ami él, az valamiféle mozgásban van, változik. A beszéd változása, módosulása időről időre az élet jele. A nyelv tudatos használóinak fontos feladata, hogy ezekre a tendenciákra odafigyeljenek, s joguk legyen elsődlegesen megítélni azokat (Deme László, Az anyanyelvészet fogalma és társadalmi feladatai. In: A magyar nyelv az informatika korában. Szerk. Glatz Ferenc. Bp., 1999. 49—56). Mindehhez pedig a beszéd teljes mechanizmusának megismerése, valamint a beszélő és a hallgató nyelvhasználati folyamatainak objektív tanulmányozása és leírása szükséges.

* Elhangzott a Magyar Nyelvtudományi Társaság 1999. december 7-i közgyűlésén.

Gósy Mária

Vissza a Tartalomhoz

Invariance and change in speech

The paper gives an overview on various types of change and invariance of speech production and speech perception. The factors of age, speech tempo, emotions, alcohol, eating, tip of the tongue, slip of the ear and some disorders are discussed by means of acoustic, phonetic and experimental psycholinguistic data. Transmission of the speech signal is also considered (e.g. the effect of noise). The reasons that responsible for 'sound changes' are defined, and the two phases of the process of the 'sound changes' are discussed.

Mária Gósy

Beck to Contents