NGUYỄN THIỆN GIÁP
(GS TS, Trường Đại học Quốc gia Hà Nội)
Thực tế trong những năm gần đây khi phân tích từ vựng tiếng Việt về mặt nguồn gốc, nhiều luận văn cao học và luận án tiến sĩ thường phân biệt từ thuần Việt với từ Hán Việt như là sự đối lập giữa một bên là từ bản ngữ và một bên là từ ngoại lai. Nhưng vì các khái niệm từ thuần Việt và từ ngoại lai chưa được xác định rõ ràng nên các số liệu thống kê thường ít có giá trị.
Về lí luận, có thể hiểu từ vựng thuần Việt là những từ ngữ vốn có của tiếng Việt, còn từ vựng ngoại lai là những từ ngữ mà tiếng Việt mượn của các ngôn ngữ khác. Tuy nhiên, trong thực tế việc nhận diện đâu là từ thuần Việt, đâu là từ ngoại lai không phải dễ dàng.
Hiện nay, đa số các nhà ngôn ngữ học quan niệm tiếng Việt là một ngôn ngữ thuộc nhóm Việt – Mường, tiểu chi Việt – Chứt, nằm trong khối Việt Katu, thuộc khu vực phía đông của ngành Mon – Khơ-me, họ Nam Á. Nếu chỉ coi những từ gốc Nam Á trong tiếng Việt mới là các từ thuần Việt thì số lượng các từ thuần Việt chẳng đáng là bao. Công trình sưu tập được nhiều nhất những từ gốc Nam Á trong tiếng Việt là cuốn Lược khảo lịch sử từ vựng tiếng Việt của Vũ Đức Nghiệu [6]. Trong công trình này, ông thu thập được 362 từ có nguồn gốc Việt – Mường, 145 từ có nguồn gốc proto Việt – Mường, 520 từ có nguồn gốc proto Mon – Khơ-me và khoảng 90 từ có sự tương ứng với các ngôn ngữ Nam Á khác.
Dường như không ai quan niệm chỉ những từ gốc Nam Á trong tiếng Việt mới là các từ thuần Việt. Nếu hiểu từ thuần Việt là những từ vốn có của tiếng Việt thì khi tiếng Việt tách khỏi tiếng Mường để hình thành một ngôn ngữ riêng ở miền châu thổ sông Hồng, từ vựng tiếng Việt đã có sự hoà đúc của các yếu tố Nam Á, Thái Kadai, Hán cổ và cả các yếu tố Nam Đảo nữa.
Những từ sau đây có sự tương ứng với các ngôn ngữ Tày Thái:
– bãi (đất), bánh, bắt, bóc, buộc, bừa, bún, bé, bưởi, ba ba, băm, bón (cơm), bít.
– cối, củi, cà, cá, cụt, cam, cải, cọn, cửi, cầm, cắt, cong, cứng.
– chả, chàm, chắt, chũm, chóc (chim), chấm, chùm, chuột, chạc (dây), (cuộn) chỉ, chèo, (ghi) chép, chọc.
– dần, dăng, dao phay, dứa, dừ, diều (hâu), dò, dột, dài, dám, dùn.
– đâm, đường, đực, đặt, đập, đậu, đọi, đĩa, đũng, đồn, đít, đóm, đòn, đò, (giã) đám, đồi, đắp, đốn, đôi.
– gáy, gọt, guốc, giạng, gỏi, giang, ghém, guồng, go (dệt vải).
– hái, hóp, hông (xôi).
– kim, kén, kho (thịt), khuấy, (nằm) khàn.
– lội, lau, (cơm) lam, luộc, lỗ, lấp, lút, lấm, lô (hàng).
– miếng, mướp, muỗm, muôi, méo, mít, má (chó má), mèo, mọt, mợ, (khoai) môn, (rau) muống, mắm, mương, mủng, mùa, mảnh, (mưa) móc, (sương) mù, mới.
– neo, nong, nơm, nộm, nà, nếp, nụ, ninh, núi, (mặt) nạc, nói, nom, noi, nợ, này, nọ.
– ngả (đường), ngắt, ngẫm, ngơi, ngọn, ngó, ngạnh, nghe, ngám, nghiêng.
– nhắm (rượu), nhuộm, nhổ (cỏ), nhọc, (nhỏ) nhoi.
– ổi, ớt, ức, ang, om, ách (trâu), ôm, ở, úp.
– phang, phai, (mưa) phùn, phất, phồng.
– quăng, quế, quạ, qua, quét, quặt, (nói) quàng, quen, quẹo.
– rẫy, rả (cỏ rả), rượu, rót, rang, rào, rác, rống, rút, rụng, rao, rồi, rốt.
– sả, sàng, suốt, suối, sóng, sàn (nhà).
– tẻ, tuồn, tốt, tiếng.
– (bên) trái, trai.
– thuồng luồng, thóc, trống, (rau) thơm, thoi, thóc, thêm, theo, thuộc (bài).
– vai, váng, vãi, vựa, vải, vịt, vó, vũng, vặn, vác, vập, vá, vén, văng, vắng, vét, vái, vò, vụng, việc.
– xa (dệt vải), xỏ (xin xỏ), xoã (tóc).
Những từ sau đây có sự tương ứng với các ngôn ngữ Việt Mường và Tày Thái:
– bao, bát, bể, cày, dao, đen, gạo, giặt, may, ngà voi, phân, sống, than, trùn…
Những từ sau đây có nguồn gốc Nam Đảo:
– anh, ăn.
– bà, bác, bu, bông (hoa), bụi, bự.
– cá, càng (cua), cuối, cây.
– dạ (bụng).
– đã, đang, đen, đứng, đất, đường, đêm.
– gục, gãi.
– ỉa, ít.
– kiếm (tìm), kia, kìa.
– là, làm, lắm, lưỡi, lở, lâu.
– mai, mãi, muốn, mà, mắt, mù, mửa, mê.
– nay, này, nếu, nó, ngó, nấu, ná, nghe, ngày.
– rất, rải.
– sữa, sáng, sông cái, sai, sắc, súng.
– ta, tai, tỏ, trỏ, trắng, thưa, trâu, trứng, trăng, trả, tới, trái, trốc.
– uống, vai, xa, ván.
Những từ sau đây có sự tương ứng với tiếng Hán cổ:
– bia, bụa, buồm, buồn, buồng, beo, bưng, bụt, bay, buộc, buông, bùa, búa, bụa, bố.
– cả, cải, chè, chém, chén, chìm, chúa, chuông, chuộng, chứa, cởi, chiếc, chuộc, chưng, chiêng, chiềng, chừng.
– đũa, đục, đuổi.
– hẹn, hòm, hè, hộp, hẹp.
– keo, kim, khoe, khua.
– lìa, lừa, lầu, liềm, lồng.
– mả, mạng, mèo, mẹo.
– ngà, ngói, ngựa, nộp, nôm, ngược, ngửa, ngan, nhuốc.
– qua, quẻ, quán, quen.
– thua, tựa, tiêc, tiếc, thêu, tía, tua, thước, thưa, thủa, than, thím, tin.
– vua, vẽ, vần.
– xe, xét, xưa.
Những từ gốc Hán cổ trên đây đã đi vào khẩu ngữ của nhân dân, được nhân dân Việt Nam chấp nhận như là những yếu tố của tiếng Việt.
Như vậy, những từ gốc Nam Á, gốc Tày Thái, gốc Nam Đảo, gốc Hán đã có mặt khi tiếng Việt hình thành thì đều được coi là những từ thuần Việt. Chỉ nên coi là từ mượn những từ tiếng Việt tiếp nhận của các ngôn ngữ khác sau khi tiếng Việt đã hình thành. Đó chính là những từ ngữ tiếng Việt mượn của tiếng Hán, của các ngôn ngữ Ấn – Âu và các các ngôn ngữ khác. Vấn đề đặt ra là có nên đồng nhất từ mượn với từ ngoại lai, đối lập với từ thuần Việt được coi là từ bản ngữ hay không?
Như ta biết, các từ mượn các ngôn ngữ khác đều được Việt hoá với mức độ khác nhau về các mặt ngữ âm, ngữ nghĩa và ngữ pháp. Nhiều từ mượn đã Việt hoá đến mức khó mà phân biệt với từ bản ngữ. Nếu quan niệm từ thuần Việt chỉ là những từ vốn có khi tiếng Việt mới hình thành thì sẽ không thấy sự biến đổi, phát triển của bản thân tiếng Việt. Quan niệm như vậy khiến cho số lượng từ bản ngữ chẳng đáng là bao so với các từ ngoại lai và không phản ánh đúng bản chất của tiếng Việt. Bản sắc của tiếng Việt không phải chỉ là những yếu tố vốn có của tiếng Việt mà còn bao gồm cả những yếu tố tiếng Việt tiếp nhận của các ngôn ngữ khác biến nó thành bộ phận không thể thiếu của mình. Vì thế, những từ mượn các ngôn ngữ khác nhưng có mức độ Việt hoá cao cũng được coi là những từ thuần Việt. Những từ mượn có mức Việt hoá thấp, vẫn còn giữ dấu ấn của ngoại ngữ thì được gọi là từ ngoại lai. Cho nên, bên cạnh khái niệm từ thuần Việt, cần phân biệt các khái niệm từ gốc, từ mượn, từ ngoại lai và từ ngoại khi phân tích từ vựng tiếng Việt.
Những từ ngữ mượn tiếng Hán được chia thành hai loại: những từ ngữ mượn tiếng Hán đọc theo âm Hán Việt và những từ ngữ mượn tiếng Hán không đọc theo âm Hán Việt.
Cách đọc Hán – Việt là cách đọc chữ Hán ở Việt Nam của người Việt Nam. Cách đọc đó phản ánh dạng ngữ âm của chữ Hán thời Đường được dạy và học ở Việt Nam lúc bấy giờ. Tất nhiên, so với dạng ngữ âm của chữ Hán đời nhà Đường thì cách đọc Hán – Việt cũng đã được Việt hoá ít nhiều cho phù hợp với hệ thống ngữ âm của tiếng Việt thời đó. Từ khi xuất hiện cách đọc Hán Việt thì tất cả các từ ngữ Hán được tiếng Việt mượn bằng con đường sách vở đều đọc theo âm Hán Việt và được gọi là từ ngữ Hán Việt. Những từ ngữ như chủ nghĩa xã hội, tư bản chủ nghĩa, cách mạng dân tộc, kinh tế, chính trị, v.v. mặc dù mới được mượn trong thời hiện đại nhưng chúng vẫn được phát âm theo cách đọc Hán Việt, tức là cách đọc chữ Hán ở Việt Nam thời nhà Đường.
Những từ ngữ Hán Việt gồm hai loại là: những từ ngữ Hán Việt mượn nguyên khối từ tiếng Hán và những từ ngữ Hán Việt được cấu tạo ở Việt Nam.
Về nguồn gốc, có thể phân những từ ngữ Hán Việt mượn nguyên khối từ tiếng Hán thành 3 loại nhỏ:
– Những từ ngữ vốn có trong tiếng Hán, thí dụ: anh hùng, bá quyền, v.v.
– Những từ ngữ gốc Nhật , thí dụ: ám thị, biên chế, biểu quyết, dân chủ, kế hoạch, v.v.
– Những từ gốc Nam Á và tiếng Việt, thí dụ: cảm lãm, phù lưu, tân lang, dạ tử, tiêu (chuối), giang (sông), v.v.
Những từ ngữ Hán Việt được cấu tạo ở Việt Nam gồm hai loại: những đơn vị do các yếu tố Hán Việt tạo thành, thí dụ: thủ pháo, cách trở, kỉ vật, sinh tố,… và những đơn vị do các yếu tố Hán Việt và thuần Việt tạo thành, thí dụ: binh lính, cướp đoạt, đói khổ, tàu hoả,… Đối với những đơn vị do các yếu tố Hán Việt tạo thành, cần phân biệt hai trường hợp:
– Thuận cú pháp tiếng Hán, thí dụ: hải phận, không quân, lâm tặc, tâm hồn, v.v.
– Nghịch cú pháp tiếng Hán, thí dụ: điểm cao, trưởng khoa, trưởng phòng, trưởng ti, v.v. Bởi vì ấn tượng về tính ngoại lai của đơn vị từ vựng là do tính chất của các yếu tố cấu tạo và quan hệ cú pháp giữa chúng gây nên, cho nên các đơn vị do các yếu tố Hán Việt tạo thành thuận theo cú pháp tiếng Hán có thể xếp vào diện các từ ngoại lai gốc Hán. Cách giải quyết này xuất phát từ một thực tế là đa số người Việt không phân biệt được từ Hán Việt mượn nguyên khối của tiếng Hán và từ Hán Việt cấu tạo ở Việt Nam. Những đơn vị được cấu tạo bằng các yếu tố Hán Việt nhưng thuận theo cú pháp tiếng Việt và những đơn vị được cấu tạo bằng yếu tố Hán Việt + yếu tố thuần Việt thì có thể xếp vào bộ phận từ vựng thuần Việt bởi vì mức độ Việt hoá trong những trường hợp như vậy cao hơn.
Những từ ngữ mượn tiếng Hán không đọc theo âm Hán Việt là những từ Hán Việt Việt hoá, thí dụ: vá, vốn, gan, gần, giấy, lại, lẽ, v.v. và những từ mượn tiếng Hán qua con đường khẩu ngữ mà chủ yếu là khẩu ngữ của một địa phương nào đó, thí dụ: mì chính, vằn thắn, quẩy, ca la thầu, lục đậu xá, wosu, confu, v.v.
Về mặt nguồn gốc, những từ Hán Việt Việt hoá là những từ gốc Hán, nhưng vì đã Việt hoá ở mức độ cao cho nên nói chung người Việt không coi chúng là những từ ngoại lai mà coi chúng là những từ thuộc bản ngữ – những từ thuần Việt. Chỉ nên coi là từ ngoại lai những từ gốc Hán đa âm tiết đọc theo cách phát âm địa phương, như mì chính, vằn thắn, quẩy, ca la thầu, lục đậu xá, wosu, confu. Từ mượn tiếng Hán đọc theo cách phát âm địa phương, có hình thức trùng với âm tiết, như quẩy cũng khó phân biệt với từ thuần Việt.
Đến đây chúng ta có thể phân biệt các khái niệm: từ gốc Hán, từ mượn Hán, từ Hán Việt, từ ngoại lai gốc Hán và từ Hán. Tất cả những từ bắt nguồn từ tiếng Hán được gọi là từ gốc Hán trong tiếng Việt. Tuy nhiên, không phải tất cả các từ bắt nguồn từ tiếng Hán đều được coi là từ mượn Hán. Những từ Hán cổ vốn có trong tiếng Việt từ khi tiếng Việt mới hình thành, do đó phải coi chúng thuộc lớp từ thuần Việt, tức là lớp từ bản ngữ chứ không phải từ mượn Hán. Chỉ nên coi là từ mượn Hán những từ gốc Hán được người Việt Nam tiếp nhận của tiếng Hán sau thời kì hình thành ngôn ngữ dân tộc. Những từ mượn Hán có thể đọc theo âm Hán Việt hoặc không đọc theo âm Hán Việt. Từ Hán Việt là những từ mượn tiếng Hán đọc theo âm Hán Việt. Tuỳ theo mức độ Việt hoá mà một bộ phận các từ mượn Hán được người Việt Nam coi là thuần Việt. Do có tính Việt hoá ở mức cao nên những từ Hán Việt Việt hoá cũng được coi là những từ thuần Việt. Chỉ những từ mượn Hán có mức độ Việt hoá thấp mới được coi là những từ ngoại lai gốc Hán. Từ ngoại lai gốc Hán bao gồm những từ Hán Việt mượn nguyên khối từ tiếng Hán, những từ Hán Việt được cấu tạo ở Việt Nam dựa vào yếu tố Hán Việt và cú pháp tiếng Hán và những từ tiếp nhận qua con đường khẩu ngữ địa phương chưa Việt hoá cao. Như vậy, không phải tất cả các từ mượn Hán đọc theo âm Hán Việt đều là từ ngoại lai. Theo GS. Nguyễn Tài Cẩn, có đến 25% từ Hán Việt hoạt động tự do, thí dụ: tuyết, trúc, ong, v.v. Những từ Hán Việt hoạt động tự do cũng nên coi là những từ thuần Việt. Những từ Hán (đọc theo âm Hán Việt) chưa được tiếng Việt mượn chính là các từ ngoại. Trong tiếng Việt, những từ nước ngoài đã nhập hệ thì được gọi là từ ngoại lai, những từ nước ngoài chưa nhập hệ thì gọi là từ ngoại.
Nhìn chung, đối với hiện tượng tiếp nhận từ vựng của các ngôn ngữ Ấn – Âu trong tiếng Việt cần chú ý:
a) Tiếng Việt chỉ mới tiếp xúc với các ngôn ngữ Ấn – Âu trong thời gian gần đây, sau khi đã tiếp nhận một cách có hệ thống rất nhiều từ gốc Hán, cho nên những từ tiếng Việt tiếp nhận của các ngôn ngữ Ấn – Âu chỉ có tính chất lẻ tẻ không thành hệ thống như các từ tiếp nhận của tiếng Hán. Đồng thời những từ tiếng Việt tiếp nhận của các ngôn ngữ Ấn – Âu cũng chỉ tập trung vào một số lĩnh vực nhất định, thường là các thuật ngữ khoa học kĩ thuật.
b) Tiếng Việt và tiếng Hán cùng là các ngôn ngữ đơn lập, các từ tiếp nhận của tiếng Hán dễ dàng nhập hệ hơn là các từ tiếp nhận của các tiếng Ấn Âu, cho nên thường xảy ra hiện tượng tiếng Việt không tiếp nhận trực tiếp các ngôn ngữ Ấn – Âu mà tiếp nhận gián tiếp qua tiếng Hán (các từ tiếp nhận kiểu này được xếp vào các từ gốc Hán).
c) Ngoài hiện tượng tiếp nhận cả về hình thức lẫn ý nghĩa của các từ ngôn ngữ Ấn – Âu, trong tiếng Việt còn có cả những từ ngữ có tính chất sao phỏng: chắn bùn, chắn xích, chiến tranh lạnh, giết thời gian, v.v. là sao phỏng garde bou, garde chaine, guerre froide, tuer le temps, v.v. của tiếng Pháp. Các đơn vị từ vựng như: kế hoạch năm năm, thi đua xã hội chủ nghĩa, vườn trẻ, v.v. là sao phỏng của các từ Nga tương ứng.
Về mặt nào đó, từ sao phỏng là những từ được cấu tạo bằng cách dịch từng yếu tố có tính chất hình thái học của các từ nước ngoài. Nhưng đối với tiếng Việt việc dịch các thuật ngữ Ấn Âu là cả một công việc có tính chất sáng tạo bởi vì cơ cấu của tiếng Việt và ngôn ngữ Ấn Âu khác nhau rất xa. Dấu ấn bản ngữ ở những từ sao phỏng thuật ngữ Ấn – Âu rất rõ.
Theo quy luật chung, tất cả các từ mượn trong tiếng Việt đều có sự biến đổi về ngữ âm sao cho phù hợp với hệ thống ngữ âm của tiếng Việt.
Mức độ Việt hoá các từ mượn các ngôn ngữ Ấn – Âu không giống nhau. Những từ tiếp nhận bằng con đường khẩu ngữ thường được Việt hoá nhiều hơn các từ tiếp nhận bằng con đường sách vở.
Nhiều từ mượn các ngôn ngữ Ấn – Âu đã Việt hoá cao độ, không khác gì các từ thuần Việt, thí dụ: săm, xích, líp, lốp, gác, bốt, kem, bơ, cuốc, bơm, van, phanh, gam, v.v.
Trong hiện tượng trộn mã, chẳng hạn, những cách viết trộn nhiều từ Anh, từ Pháp vào tiếng Việt như: “Sorry mày nha, tối qua papa với mama cắt cơm, money hết sạch, chứ không thì tao đi overnight với tụi bay rồi. Từ đây tới chiều có chương trình gì phone cho tao một tiếng. See you.” (Báo Hoa học trò, 2002) thì những từ gốc ngoại nên coi là từ ngoại, tức là những từ của ngoại ngữ chứ chưa phải là từ mượn trong tiếng Việt.
Như vậy, nếu xác định từ thuần Việt không chỉ căn cứ vào nguồn gốc mà căn cứ cả vào quá trình vận động và phát triển của tiếng Việt thì từ thuần Việt không đối lập với từ mượn mà đối lập với từ ngoại lai. Từ ngoại lai trong tiếng Việt là những từ mượn của các ngôn ngữ khác vẫn còn giữ dấu ấn của ngoại ngữ. Những từ mượn của ngôn ngữ khác nhưng có sự đồng hoá cao thường được coi là từ bản ngữ, thuần Việt. Dấu ấn để được coi là có mức độ Việt hoá cao là từ có hình thức của một âm tiết, hoạt động tự do. Trong bối cảnh như thế, những từ vốn là bản ngữ nhưng hiện nay có cấu trúc không nhập hệ, tức là có những nét không nhập hệ vào cấu trúc đương thời của tiếng Việt (thí dụ: leng keng, eng éc, mèng, béng, bù nhìn, mồ hóng, mồ hôi, lê ki ma, v.v.) lại nên xếp vào lớp từ ngoại lai. Những từ tiếng nước ngoài chưa nhập hệ được gọi là những từ ngoại.
Cách xử lí như thế là hợp lí bởi vì yêu cầu cơ bản của phép biện chứng trong khoa học là cần phải nghiên cứu các hiện tượng cả trong các mối liên hệ lẫn trong sự phát triển của chúng. Tách rời đồng đại và lịch đại sẽ hai lần vi phạm yêu cầu cơ bản đó: khi nghiên cứu ngôn ngữ về mặt đồng đại, người ta chỉ khảo sát các hiện tượng trong mối liên hệ mà không chú ý tới sự phát triển, còn khi nghiên cứu ngôn ngữ về mặt lịch đại người ta lại chỉ khảo sát các hiện tượng trong sự phát triển chứ không chú ý đến mối liên hệ. Cần phải nghiên cứu các hiện tượng ngôn ngữ cả trong mối liên hệ lẫn trong sự phát triển một cách đồng thời: trong mỗi trạng thái ngôn ngữ, phải vạch ra những hiện tượng đang lùi vào quá khứ và những hiện tượng đang xuất hiện trên cái nền của những hiện tượng ổn định, có tính chất chuẩn mực đối với trạng thái ngôn ngữ đó [3].
THƯ MỤC THAM KHẢO
1. Trần Trí Dõi, Khái niệm từ thuần Việt và từ ngoại lai từ góc nhìn của lịch sử tiếng Việt hiện nay, Ngôn ngữ, số 11, 2011.
2. Nguyễn Thiện Giáp, Từ vựng học tiếng Việt, NXB Đại học và Trung học chuyên nghiệp, Hà Nội, 1985.
3. Nguyễn Thiện Giáp, Từ và nhận diện từ tiếng Việt, NXB Giáo dục, Hà Nội, 1996.
4. Nguyễn Thiện Giáp, Từ và từ vựng học tiếng Việt, NXB Đại học Quốc gia Hà Nội, 2014.
5. Nguyễn Văn Khang, Từ ngoại lai trong tiếng Việt, NXB Giáo dục, Hà Nội, 2007.
6. Vũ Đức Nghiệu, Lược khảo lịch sử từ vựng tiếng Việt, NXB Giáo dục, Hà Nội, 2011.