به گزارش پایگاه خبری تحلیلی تسریر، این فرهنگنویس و ویراستار در تازهترین نوشتار خود که آن را در صفحه شخصیاش منتشر کرده، با عنوان «شمار واژههای عربیِ رایج در فارسی» چنین آورده است:
برخی معتقدند نیمی از واژههای رایج در فارسی عربی است. معیار این افراد برای دست یافتن به این آمار بر نگارنده روشن نیست، ولی میدانم که برای شمارش واژههای عربیِ رایج در فارسی با چند پرسش روبهرو هستیم:
۱. فارسی معاصر را باید در نظر داشته باشیم یا آمیختهای از فارسی کهن و معاصر یا فقط فارسی کهن را؟ برای نمونه، آیا باید برخی واژههای عربیِ بهکاررفته در دُرۀ نادره و تاریخ وصاف و تاریخ جهانگشای را، حتی اگر فقط یک بار در تاریخ زبان فارسی بهکار رفته باشد، جزو واژههای عربیِ رایج در فارسی بهشمار بیاوریم؟
۲. با هزاران واژۀ مشتق (مانند طفلک) و مرکّب (مانند کتابخانه) و مشتقمرکّب (مانند وطنپرستی) چه کنیم و این واژهها را فارسی بدانیم یا عربی ـ فارسی؟
۳. واژههای عربیِ کمبسامدی مانند مالالتجاره و موطن و مافات را با واژههای عربیِ پربسامدی مانند غم و کتاب و ساعت یکسان در شمار بیاوریم؟
۴. فارسی گفتاری را باید در نظر داشته باشیم یا فارسی نوشتاری را؟ روشن است که بسامد واژههای عربی در فارسی گفتاری کمتر از فارسی نوشتاری است.
برای دست یافتن به شمارِ تقریبیِ واژههای عربی در فارسی چند معیار را پیش روی خود قرار دادهام. نکتۀ بسیار مهم اینکه این معیارها با توجه به امکانات من بوده و لزوماً درستترین و بینقصترین معیارها نیستند. نخست این معیارها را با توجه به پرسشهای بالا یادآور میشوم:
۱. فقط واژههای رایج در فارسی معاصر را شمارش کردهام و با واژههای بهکاررفته در متنهای کهن کاری نداشتهام. البته اگر بخواهیم به سبکشناسی و زبانشناسی تاریخی بپردازیم، شمارش واژههای کهن نیز اهمیت دارد، ولی مخاطب خود را عموم مردم و غیرمتخصصان دانستهام و آنها با فارسی کهن سروکاری ندارند.
۲. بهدلیل کمبود وقت و امکانات، واژههای مشتق و مرکّب و مشتقمرکّبِ عربی ـ فارسی را فارسی دانستهام و آگاهم که این روش از دقت آمار میکاهد.
۳. بهدلیل کمبود وقت و امکانات، واژههای عربیِ کمبسامد را با واژههای عربیِ پربسامد یکسان در شمار آوردهام و آگاهم که این روش نیز از دقت آمار میکاهد. یعنی اگر یک فارسیزبان روزی ده بار واژۀ ساعت را بهکار ببرد، ولی در عمرش فقط یک بار موطن را بهکار ببرد، بسامد هر دو واژه را عدد ۱ درنظر گرفتهام (در زبانشناسی پیکرهای به دو مفهوم token و type پرداخته شده که در اینجا به آنها نمیپردازم). درستتر این است که تکرار نیز در آمار واژههای عربیِ رایج در فارسی نقش داشته باشد و با وقت و امکانات اندکی که دارم نتوانستم تکرار را نیز در آمار خود بیاورم.
۴. فقط به فارسی نوشتاری پرداختهام.
منبع نگارنده برای شمارش وامواژههای رایج در فارسی فرهنگی فارسی است که خودم آن را تألیف کردهام و هنوز منتشر نشدهاست.
شمار وامواژههای برگرفته از برخی زبانها، مانند انگلیسی، بسیار بیش از چیزی است که در پایین آمده، ولی هنوز آنها را به فرهنگ نیفزودهام. با تکمیل فرهنگ این آمار دستخوش اندکی دگرگونی خواهد شد.
این احتمال را در نظر داشته باشید که ممکن است معدودی از ریشهها درست نباشد. این مشکل در کلیت آمار تأثیر چندانی ندارد.
شمارش دقیقترِ وامواژههای رایج در فارسی میتواند موضوع مقالهای زبانشناختی باشد. امید است که دوستان زبانشناس با مراجعه به پیکرههای زبانیِ برچسبزنیشده پژوهشهای کاملتر و دقیقتری انجام دهند.
اینک شمار وامواژههای رایج در فارسی به تفکیکِ هر زبان:
– واژههای فرهنگ: ٢١۸١۶ (١۰۰ درصد)
– واژههای فارسی (و «زبان دیگر + فارسی»): ۱۱۸۰٢ (۵۴.۱۰ درصد)
– واژههای عربی: ۷۳۵۳ (۳۳.۷۰ درصد)
– واژههای فرانسوی: ۱۸۳۵ (۸.۴۱ درصد)
– واژههای ترکی / مغولی: ۲۷۸ (۱.۲۷ درصد)
– واژههای انگلیسی: ۲۳۴ (۱.۰۷ درصد)
– واژههای روسی: ۷۰ (۰.۳۲ درصد)
– واژههای هندی / سنسکریت: ۶۶ (۰.۳ درصد)
– واژههای یونانی: ٢۵ (۰.۱۱ درصد)
– واژههای برگرفته از زبانهای دیگر: ۱۵۳ (۰.۷ درصد)
پ.ن: رسمالخط نگارنده در بازتاب این نوشتار حفظ شده است.