از ری تا شهرری. واژه‌ها بلند هم می‌شوند

Claude_Shannon_07هم شهود عامیانه و هم پژوهش‌های زبان‌شناختی به ما می‌گویند که واژه‌هایی که برای گروهی پرکاربرد باشند و شکل طولانی‌ای داشته باشند، به تدریج در گفتار کوتاه می‌شوند یا با یک گزینه کوتاه‌تر جایگزین می‌شوند. به این ترتیب است که در فارسی شابدلظیم جایگزین شاه‌عبدالعظیم می‌شود و آقا-خداوند تبدیل به «آخوند» می‌شود (ریشه داشتن واژه آخوند در خداوند را از سبک‌شناسی محمدتقی بهار نقل می‌کنم) و صفت «هسته‌ای» جای گروه اسمی «مساله انرژی هسته‌ای» را می‌گیرد (مثال: «روحانی توی هسته‌ای خوب عمل کرد»!). و به همین ترتیب است که در انگلیسی برای «باغ وحش» عبارت زولاجکال گاردن تبدیل به زو می‌شود و در فرانسه به جای سمپاتتیک می‌گویند سمپا و گاهی به جای فیلوسوفی می‌گویند فیلو. این کوتاه شدن‌ها در برخی گروه‌های خاص و بسته اشکال مخصوص آن گروه را هم پیدا می‌کند. مثل همکلاسی‌های سابقم در دانشگاه شریف که حل‌تمرین را به حلّت و ریاضیات مهندسی را به ریزمو و الکترونیک دیجیتال را به الک‌دیجیت تبدیل کرده بودند.

به بیان فنی‌تر، اتفاقی که می‌افتد این است که اگر میزان اطلاعات منتقل شده توسط یک کلمه کم باشد (کلمه قابل‌انتظار/پرکاربرد باشد) گویشور دلش نمی‌خواهد تعداد واج زیادی خرجش کند. به همین دلیل است که کلمات پرکاربرد/کم‌محتوایی مثل حروف اضافه (از، به، در،…) معمولا کوتاهند و کلمات هرچه تخصصی‌تر و کم‌کاربردتر و در نتیجه منتقل کننده اطلاعات بیشتری هستند (از منظر نظریه اطلاعات) بیشتر ممکن است طولانی باشند (مثل پساساختارگرایی، ریزپردازنده، نظارت استصوابی).

آن‌چه کمتر به آن توجه می‌شود این است که به نظر می‌رسد که این فرآیند در جهت عکس هم عمل می‌کند. یعنی اگر کلمه‌ای حاوی اطلاعات زیادی باشد (نسبتا کم‌کاربرد باشد) انگار که گویشوران زبان نمی‌پسندند که کلمه بیش از حد کوتاه باشد. مثلا کلمه تک‌هجایی‌ای که فقط دو سه واج دارد معمولا برای واژه‌ای غیر از حروف اضافه و افعال ربطی و مانند این‌ها چندان مورد پسند نیست. در اسم‌های خاص به راحتی می‌توان اثر این پدیده را مشاهده کرد که اگر نام خانوادگی کسی کوتاه باشد، تمایل بیشتری به تلفظ اسم کوچکش در کنار نام خانوادگی‌اش وجود دارد. همه ما با نام خانوادگی درباره تولستوی و داستایوسکی و بالزاک و استاندال حرف می‌زنیم اما به جای «مان» می‌گوییم توماس مان و به جای «بُل» می‌گوییم هاینریش بُل و به جای «ژید» می‌گوییم آندره ژید. به همین ترتیب، به نظر می‌رسد که گفتن دی‌ماه و مهرماه به جای دی و مهر بسیار رایج‌تر باشد تا گفتن خردادماه و اسفندماه به جای خرداد و اسفند. حتی ظن این را دارم که تغییر نام «ری» به شهرری در طول زمان تابع همین فرآیند بوده باشد.

نظریه مطرح در این باره این است که گویشور سعی می‌کند در زمان حرف زدن میزان اطلاعات منتقل شده در واحد زمان ثابت باشد. (باز هم به مقاله سال ۲۰۰۸ Frank و Jaeger اشاره می‌کنم). هرچه واژه یا مفهوم خارج شده از دهان گوینده پیچیده‌تر یا غیرمنتظره‌تر یا خاص‌تر باشد، گویشور سعی می‌کند بیانش را طولانی‌تر کند و هرچه پیام پیش‌پاافتاده‌تر، یا به عبارت دقیق‌تر پیش‌بینی‌پذیرتر باشد گویشور آن را کوتاه‌تر می‌کند. این فرآیند فقط انتخاب کلمات را تغییر نمی‌دهد بلکه حتی سرعت ادای کلمات را هم تغییر می‌دهد، و گاهی باعث می‌شود گوینده استفاده از کلمات اختیاری غیرضروری (مثل «که» در «دیدم که رفته») برای این تنظیم نرخ انتقال اطلاعات استفاده کند.

اما چرا گویشور سعی می‌کند نرخ انتقال اطلاعات خطی باشد؟ در این باره دو دلیل مطرح شده است. دلیل اول آن است که اگر فرض کنیم نرخ بهینه‌ای برای این کار وجود داشته باشد (با توجه به توان تولید گوینده و توان فهم شنونده) طبیعی است که فرض کنیم گوینده ناخودآگاه سعی می‌کند همیشه به این نرخ بهینه نزدیک باشد، و در نتیجه نرخ در طول گفتار همگن خواهد بود. دلیل دوم معرفی شده توسط فرانک و یگر، که به نظر من جالب‌تر و البته پیچیده‌تر است (از این جا به بعد متن را اگر حوصله بحث فنی ندارید نخوانید!)، این است که ممکن است میزان دشواری فهم هر پاره گفتار (مثلا هر ثانیه از گفتار) برای شنونده تابعی توانی (و نه خطی) از میزان اطلاعات موجود در آن پاره گفتار باشد. در آن صورت چون مجموع دشواری‌ای که شنونده متحمل می‌شود حاصل‌جمع این توان‌ها برای تمام آن پاره‌گفتارهاست، برای شنونده بهترین حالت این است که میزان اطلاعات بین پاره‌های گفتار پخش شود تا دشواری کمینه شود. مثلا اگر چهار واحد اطلاعات داشته باشیم و میزان دشواری درک یک پاره گفتار با الف واحد اطلاعات الف به توان دو باشد، و اگر بخواهیم این چهار واحد اطلاعات را بین دو کلمه پخش کنیم، دو راه داریم. راه اول این است که یک کلمه ۳ واحد اطلاعات بگیرد و کلمه دیگر ۱ واحد. در این صورت مجموع دشواری برابر خواهد بود با ۹ (سه به توان دو) به علاوه ۱ (یک به توان دو) یعنی ۱۰. اما اگر به هر کلمه ۲ واحد اطلاعات بدهیم مجموع دشواری برابر خواهد بود با ۴ به علاوه ۴ یعنی ۸. ادعا این است که طی فرآیندهای ناخودآگاهی که هنوز از دقایق چند و چونشان آگاه نیستیم، گفتار در زبان انسانی به نفع شنونده (علاوه بر گوینده) بهینه شده است!

6 فکر می‌کنند “از ری تا شهرری. واژه‌ها بلند هم می‌شوند

  1. سارا بهرامی

    . بعضی از اساتید فارسی میگن که حُسن!!! زبان فارسی در اینه که کودکان انگلیسی نمیتونن شکسپیر ۴۰۰ سال پیش رو بخونن ولی کودکان ایرانی میتونن شاهنامه فارسی رو بخونن به راحتی و باهاش ارتباط برقرار کنن!
    ولی به نظر من،این یه حسن نیست یه عیبه! به نظر من نشان دهنده رکود و سکون در زبان فارسیه! ولی انگلیسی یک زبان پویاست

    پاسخ
  2. سارا بهرامی

    ۲-اینم در یک مقاله کوتاه خوندم که محققان انگلیسی اگر اشتباه نکنم در قرن هفدهم شاید کمی پیشتر!!! زبان یونانی و لاتین رو مورد مطالعه قرار دادن و بسیاری از وندها و ریشه هایی از این زبان رو برای زبان انگلیسی به عاریه گرفتن. اینکه الان مبینیم بیشتر ریشه کلمات و وندها ریشه یونانی دارن مربوط به همین دورانه.دورانی که رنسانس شروع شده و علوم وفنون جدید در حال شکل گیری و پیشرفت هستن و نیاز به واژه های جدید برای توصیف این علوم و زایایی زبانه.
    کلا زبان انگلیسی از بالا به جهان مینگره و فارسی از یک روزنه!
    ممکنه نظرتون رو در مورد مسئله یک و دو بدونم. اگه ممکنه میشه درموردشون مطلب بذارید.ممنون

    پاسخ
  3. mmahdavim نویسنده

    سلام!
    ببخشید فراموش کردم پاسخ بدم! شرمنده! خیلی متشکرم از کامنتتون!

    درباره مورد یک واقعا نظری ندارم. یعنی واقعا مطمئن نیستم علت این تفاوت بین فارسی و انگلیسی چیه، و نمی‌دونم که فارسی فقط در نسخه نوشتاری این‌قدر محافظه‌کار مونده یا حتی با احتساب فارسی گفتاری امروز هم می‌تونیم محافظه‌کار محسوبش کنیم. در نتیجه واقعا قضاوتی ندارم!

    درباره مورد دوم، من متخصص این امر نیستم ولی تا جایی که می‌دونم استفاده از وندها و ریشه‌های یونانی و لاتین از قرن‌ها پیش به طور بسیار گسترده در جهان انگلیسی‌زبان وجود داشته. کافیه نگاه کنیم که شکسپیر (که بیشتر عمرش رو در قرن ۱۶ بوده) چه قدر زیاد از کلمات یونانی و لاتین استفاده می‌کنه. در غزلواره معروف «shall I compare thee…» در بیت اول هر مصرعش یه کلمه لاتین داره. حتی اشعار چاسر شاعر قرن چهارده هم پر از کلمات لاتینه. در نتیجه منظور اون مقاله رو دقیقا متوجه نمی‌شم.

    شاید منظور اینه که جهان انگلیسی‌زبان از قرن هفده برای تولید واژگان علمی و تخصصی شروع کرد به استفاده مصنوعی و عامدانه از تکواژهای لاتین و یونانی. (مثل تلفن از ترکیب tele و phone). ولی خب همین امر هم به نظرم نمی‌آد که مخصوص جهان انگلیسی‌زبان باشه. ما در فارسی هم با عربی همین کار رو کرده‌ایم. وقتی کلمه‌ای مثل «تاریخ‌نگاری» رو خلق می‌کنیم داریم از ریشه‌های فارسی و عربی کنار هم استفاده می‌کنیم. وقتی واژه «ممنوع التصویر» رو می‌سازیم داریم از ریشه‌ها و وندهای عربی برای تولید کلمه استفاده می‌کنیم. کلا تا جایی که من می‌فهمم آن‌چه ما با عربی کرده‌ایم فرقی با آن‌چه انگلیسی با لاتین و فرانسه کرده نداره.

    این که نهایتا انگلیسی از فارسی زایاتر و پرواژه‌تره، نظر من اینه که علتش فرازبانیه. یعنی ربطی به ساختارهای زبانی و حتی ترجیحات زبانی گویشوران نداره، بلکه تابع موقعیت سیاسی و اقتصادی برتر انگلیسیه. همین انگلیسی که امروز این قدر چابک و قدرتمند به نظر می‌آد دویست سال پیش در مقابل فرانسه الکن محسوب می‌شد، و همین انگلیسی و فرانسه پونصد سال پیش جلوی لاتین هیچ بودند، و همین لاتین نهصد سال پیش برتری جدی‌ای در مقابل عربی و حتی شاید فارسی نداشت.

    پاسخ
  4. بهاراتها

    چه جالب! عمل در جهت عکس فرایندو دارم می‌گم.
    قبلاً به این فکر کرده بودم که گاهی چه دوست دارم اطرافیانمو که صدا می‌کنم به جای مخفف کردن اسمشون یه اسم خودمونی طولانی‌تری بسازم براشون. نحوه «مصغر»سازی اسما تو روسی –که گاهی اسم طرف طولانی‌تر می‌شه– خیلی به نظرم قابل درک و فهمیدنی می‌رسید. برا خودم این تمایلو این‌جور توجیه کرده بودم که چون طرفم رو دوست دارم، دوست دارم که مدت زمان بیشتری به گفتن اسمش مشغول باشم. الآن می‌بینم که این می‌تونه حالت خاص یه حالت کلی باشه.

    پاسخ

پاسخ دهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

شما می‌توانید از این دستورات HTML استفاده کنید: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>