بایگانی برچسب: s

از ری تا شهرری. واژه‌ها بلند هم می‌شوند

Claude_Shannon_07هم شهود عامیانه و هم پژوهش‌های زبان‌شناختی به ما می‌گویند که واژه‌هایی که برای گروهی پرکاربرد باشند و شکل طولانی‌ای داشته باشند، به تدریج در گفتار کوتاه می‌شوند یا با یک گزینه کوتاه‌تر جایگزین می‌شوند. به این ترتیب است که در فارسی شابدلظیم جایگزین شاه‌عبدالعظیم می‌شود و آقا-خداوند تبدیل به «آخوند» می‌شود (ریشه داشتن واژه آخوند در خداوند را از سبک‌شناسی محمدتقی بهار نقل می‌کنم) و صفت «هسته‌ای» جای گروه اسمی «مساله انرژی هسته‌ای» را می‌گیرد (مثال: «روحانی توی هسته‌ای خوب عمل کرد»!). و به همین ترتیب است که در انگلیسی برای «باغ وحش» عبارت زولاجکال گاردن تبدیل به زو می‌شود و در فرانسه به جای سمپاتتیک می‌گویند سمپا و گاهی به جای فیلوزوفی می‌گویند فیلو. این کوتاه شدن‌ها در برخی گروه‌های خاص و بسته اشکال مخصوص آن گروه را هم پیدا می‌کند. مثل دانشجویانی که حل‌تمرین را به حلّت و ریاضیات مهندسی را به ریزمو و الکترونیک دیجیتال را به الک‌دیجیت تبدیل کرده‌اند.

به بیان فنی‌تر، اتفاقی که می‌افتد این است که اگر میزان اطلاعات منتقل شده توسط یک کلمه کم باشد (کلمه قابل‌انتظار/پرکاربرد باشد) گویشور دلش نمی‌خواهد تعداد واج زیادی خرجش کند. به همین دلیل است که کلمات پرکاربرد/کم‌محتوایی مثل حروف اضافه (از، به، در،…) معمولا کوتاهند و کلمات و عبارات هرچه تخصصی‌تر و کم‌کاربردتر و در نتیجه منتقل کننده اطلاعات بیشتری هستند (از منظر نظریه اطلاعات) بیشتر ممکن است طولانی باشند (مثل پساساختارگرایی، ریزپردازنده، نظارت استصوابی).

آن‌چه کمتر به آن توجه می‌شود این است که به نظر می‌رسد که این فرآیند در جهت عکس هم عمل می‌کند. یعنی اگر کلمه‌ای حاوی اطلاعات زیادی باشد (نسبتا کم‌کاربرد باشد) انگار که گویشوران زبان نمی‌پسندند که کلمه بیش از حد کوتاه باشد. مثلا کلمه تک‌هجایی‌ای که فقط دو سه واج دارد معمولا برای واژه‌ای غیر از حروف اضافه و افعال ربطی و مانند این‌ها چندان مورد پسند نیست. در اسم‌های خاص به راحتی می‌توان اثر این پدیده را مشاهده کرد که اگر نام خانوادگی کسی کوتاه باشد، تمایل بیشتری به تلفظ اسم کوچکش در کنار نام خانوادگی‌اش وجود دارد. همه ما با نام خانوادگی درباره تولستوی و داستایوسکی و بالزاک و استاندال حرف می‌زنیم اما به جای «مان» می‌گوییم توماس مان و به جای «بُل» می‌گوییم هاینریش بُل و به جای «ژید» می‌گوییم آندره ژید. به همین ترتیب، به نظر می‌رسد که گفتن دی‌ماه و مهرماه به جای دی و مهر بسیار رایج‌تر باشد تا گفتن خردادماه و اسفندماه به جای خرداد و اسفند. حتی ظن این را دارم که تغییر نام «ری» به شهرری در طول زمان تابع همین فرآیند بوده باشد.

نظریه مطرح در این باره این است که گویشور سعی می‌کند در زمان حرف زدن میزان اطلاعات منتقل شده در واحد زمان ثابت باشد. (باز هم به مقاله سال ۲۰۰۸ Frank و Jaeger اشاره می‌کنم). هرچه واژه یا مفهوم خارج شده از دهان گوینده پیچیده‌تر یا غیرمنتظره‌تر یا خاص‌تر باشد، گویشور سعی می‌کند بیانش را طولانی‌تر کند و هرچه پیام پیش‌پاافتاده‌تر، یا به عبارت دقیق‌تر پیش‌بینی‌پذیرتر باشد گویشور آن را کوتاه‌تر می‌کند. این فرآیند فقط انتخاب کلمات را تغییر نمی‌دهد بلکه حتی سرعت ادای کلمات را هم تغییر می‌دهد، و گاهی باعث می‌شود گوینده استفاده از کلمات اختیاری غیرضروری (مثل «که» در «دیدم که رفته») برای این تنظیم نرخ انتقال اطلاعات استفاده کند.

اما چرا گویشور سعی می‌کند نرخ انتقال اطلاعات خطی باشد؟ در این باره دو دلیل مطرح شده است. دلیل اول آن است که اگر فرض کنیم نرخ بهینه‌ای برای این کار وجود داشته باشد (با توجه به توان تولید گوینده و توان فهم شنونده) طبیعی است که فرض کنیم گوینده ناخودآگاه سعی می‌کند همیشه به این نرخ بهینه نزدیک باشد، و در نتیجه نرخ در طول گفتار همگن خواهد بود. دلیل دوم معرفی شده توسط فرانک و یگر، که به نظر من جالب‌تر و البته پیچیده‌تر است (از این جا به بعد متن را اگر حوصله بحث فنی ندارید نخوانید)، این است که ممکن است میزان دشواری فهم هر پاره گفتار (مثلا هر ثانیه از گفتار) برای شنونده تابعی توانی (و نه خطی) از میزان اطلاعات موجود در آن پاره گفتار باشد. در آن صورت چون مجموع دشواری‌ای که شنونده متحمل می‌شود حاصل‌جمع این توان‌ها برای تمام آن پاره‌گفتارهاست، برای شنونده بهترین حالت این است که میزان اطلاعات بین پاره‌های گفتار پخش شود تا دشواری کمینه شود. مثلا اگر چهار واحد اطلاعات داشته باشیم و میزان دشواری درک یک پاره گفتار با الف واحد اطلاعات الف به توان دو باشد، و اگر بخواهیم این چهار واحد اطلاعات را بین دو کلمه پخش کنیم، دو راه داریم. راه اول این است که یک کلمه ۳ واحد اطلاعات بگیرد و کلمه دیگر ۱ واحد. در این صورت مجموع دشواری برابر خواهد بود با ۹ (سه به توان دو) به علاوه ۱ (یک به توان دو) یعنی ۱۰. اما اگر به هر کلمه ۲ واحد اطلاعات بدهیم مجموع دشواری برابر خواهد بود با ۴ به علاوه ۴ یعنی ۸. ادعا این است که طی فرآیندهای ناخودآگاهی که هنوز از دقایق چند و چونشان آگاه نیستیم، گفتار در زبان انسانی به نفع شنونده (علاوه بر گوینده) بهینه شده است!