Khái niệm dịch máy đã tồn tại hàng thế kỷ, nhưng mãi cho đến những năm 1950, nó mới bắt đầu trở thành hiện thực. Kể từ đó, dịch máy đã phát triển rất nhiều, mặc dù nó vẫn không thể cạnh tranh với kỹ năng và sự tinh tế mà tâm trí con người có thể áp dụng để dịch tài liệu.
 
lich su cua dich may
 
 
 
Sự ra đời của dịch máy
 
Năm 9494, Warren Weaver của Quỹ Rockefeller đã cùng nhau đưa ra một loạt đề xuất về cách biến ý tưởng dịch máy thành hiện thực Ông đã pha trộn lý thuyết thông tin, những bài học trong Thế chiến thứ hai và các nguyên tắc của ngôn ngữ tự nhiên để mở đường cho máy dịch một ngôn ngữ này sang ngôn ngữ khác.
 
Một trong những thành công dịch máy đầu tiên là thử nghiệm Georgetown-IBM. Năm 1954, IBM trình diễn tại văn phòng New York của mình một máy có thể dịch câu tiếng Nga sang tiếng Anh. Mặc dù máy chỉ có thể dịch 250 từ (thành 49 câu), thế giới đã rất vui vì ý tưởng. Sự quan tâm đến dịch máy trên khắp thế giới đã khiến tiền được đổ vào lĩnh vực khoa học máy tính mới này. Các nhà nghiên cứu thí nghiệm Georgetown, phá vỡ niềm tin của sự thành công ban đầu của họ, dự đoán rằng dịch máy sẽ được làm chủ trong vòng ba đến năm năm.
 
Những rào cản
 
Mặc dù đã đạt được thành tựu ban đầu nhưng dịch máy vẫn là một vấn đề hóc búa với các nhà nghiên cứu vào thời điểm đó. Điều này được khẳng định bởi thực tế là nó vẫn chưa thực sự được làm chủ, hơn 60 năm sau đó.
 
Những từ điển song ngữ, ngôn ngữ họ ra đời và ngữ pháp biến đổi được sử dụng để nâng cao công nghệ đằng sau thí nghiệm Georgetown. Tuy nhiên, sự mơ hồ về ngữ nghĩa đã nhanh chóng được xác định là một vấn đề. Nếu một từ có nhiều nghĩa, máy tính sẽ dịch nó như thế nào ?
 
Mặc dù các bản dịch bằng máy sớm có chất lượng đủ để bản dịch cung cấp một sự hiểu biết cơ bản về tài liệu gốc, nhưng chúng vẫn còn lâu mới là hoàn hảo. Cuộc đua (phần lớn giữa Mỹ và Liên bang Xô viết) để chinh phục bản dịch máy đã mất nhiều thời gian hơn dự kiến. Vào năm 1964, Ủy ban Cố vấn Ngôn ngữ Tự động Hoa Kỳ (ALPAC) đã thực hiện một cú đấm vào những nỗ lực của Hoa Kỳ bằng cách báo cáo rằng không đáng để tốn thời gian và chi phí vào dịch máy. Nó đề nghị các nguồn lực tập trung vào các công cụ tự động (như từ điển) để hỗ trợ những dịch giả con người trong công việc của họ.
 
Dịch thuật trên thế giới
 
Mặc dù sự quan tâm của Hoa Kỳ đã giảm trong lĩnh vực dịch máy (ngoại trừ một hoặc hai doanh nghiệp tư nhân nổi bật), các quốc gia khác vẫn tiếp tục nỗ lực của họ. Vào những năm 1970, Canada đã phát triển Hệ thống METEO để dịch báo thời tiết từ tiếng Anh sang tiếng Pháp. Hệ thống đã dịch 80.000 từ mỗi ngày và có chất lượng khá tốt từ năm 1977 đến năm 2001 trước khi được cập nhật với một hệ thống mới.
 
Ở các khu vực khác, toàn cầu hóa đã đẩy nhu cầu dịch máy như chưa bao giờ. Pháp, Đức, Liên bang Xô viết và Anh đều đang nỗ lực để làm chủ dịch máy. Nếu nghệ thuật dịch bằng máy tính có thể được hoàn thiện, thì việc tiết kiệm chi phí và thời gian để dịch các tài liệu sẽ không thể tin được. Kiến thức này thúc đẩy nhiều chính phủ và các công ty tư nhân tiếp tục nỗ lực của họ, nhưng hệ thống dịch máy hoàn hảo đã lẩn tránh họ.
 
Nhật Bản đặc biệt muốn tìm cách lãnh đạo các nước này vào những năm 1980 và đầu những năm 1990, và vào cuối những năm 90, sự sẵn có (và quyền lực) hoặc máy tính ngày càng tăng đã làm giảm chi phí dịch máy.
 
Những năm 2000 đã chứng kiến một số công ty công nghệ lớn nhất thế giới tập trung vào dịch máy bằng sự nhiệt tình hơn. Cũng như những nỗ lực của Nhật Bản, Google và Microsoft ở Mỹ đã đầu tư đáng kể vào việc dịch máy thống kê. Những nỗ lực này sau đó bao gồm việc kết hợp các hệ thống thống kê với kiến thức cú pháp và hình thái trong việc tìm kiếm các kết quả tốt hơn.
 
Mạng thần kinh và dịch máy
 
Gần đây nhất, các nhà phát triển lớn (Google, Facebook và nhóm của họ) đã bị mê hoặc bởi việc sử dụng mạng nơ-ron và học tập sâu để hoàn thiện dịch thuật máy. Mạng thần kinh được mô phỏng lỏng lẻo theo cách hoạt động của bộ não con người, với các neuron nhân tạo gửi tín hiệu cho các nơ-ron khác khi kích hoạt. Nhận dạng tiếng nói và tầm nhìn máy tính đã có những bước tiến đáng kể do mạng nơron. Dịch máy cũng đem lại lợi ích.
 
Google đã báo cáo vào năm 2016 rằng họ đã có một bước tiến đáng kể với bản dịch máy. Google Translate đã hoạt động được một thập niên, nhưng chuyển sang mạng nơ ron đã đánh dấu bước thay đổi từ những bản dịch vụng về đến những kết quả ấn tượng hơn nhiều. Điều này là nhờ hệ thống Dịch Máy Não thần kinh của Google (NMT).
 
Tóm lại, NMT của Google chuyển toàn bộ câu thay vì các từ riêng lẻ hoặc các nhóm từ nhỏ. Nó hoạt động bằng cách sử dụng một bộ mã hóa để phân chia các câu. Hệ thống sau đó đại diện cho ý nghĩa của các phần cấu thành của những câu như một vector. Như cách The Register giải thích ngắn gọn:
 
"Hệ thống giải thích toàn bộ câu, và bộ giải mã bắt đầu dịch từng từ bằng cách xem xét sự phân bố trọng số trên các vectơ được mã hoá và kết hợp chúng với các từ có liên quan nhất trong ngôn ngữ mục tiêu."
 
Thật thú vị, hệ thống NMT của Googles sau đó đã học thêm một bước nữa, bằng cách bắt đầu dịch giữa các cặp ngôn ngữ mà nó không được dạy. Các lập trình viên đã dạy hệ thống dịch từ tiếng Anh sang tiếng Bồ Đào Nha, và tiếng Anh và tiếng Tây Ban Nha. Hệ thống này sau đó trở nên có khả năng tạo bản dịch có chất lượng hợp lý giữa tiếng Bồ Đào Nha và tiếng Tây Ban Nha, mặc dù các lập trình viên của nó đã không nhập cặp ngôn ngữ đó.
 
Các bản nghiên cứu của Googler cho thấy NMT của họ đã cung cấp một ví dụ đầu tiên về sự chuyển tiếp thực sự trong quá trình dịch máy. Đây là một bước tiến đáng kể.
 
Dịch máy ngày nay
 
Sự phát triển của dịch máy chắc chắn có thể làm nhiều người phải rùng mình. Điều này đã xảy ra kể từ khi thành công của báo Georgetown được công bố rộng rãi vào năm 1954. Lúc đó, nhiều dịch giả lo lắng rằng họ sẽ không còn công việc trong một vài năm nữa. Nhiều dịch giả ngày nay cũng cảm thấy như vậy.
 
Mặc dù vậy, máy dịch vẫn chưa tinh vi để thực hiện tốt hơn các dịch giả con người. Cuộc thi này đã được thử thách vào tháng 2 năm 2017, trong một cuộc thi lịch sử được tổ chức bởi Đại học Sejong Cyber ​​và Hiệp hội Dịch thuật và phiên dịch quốc tế Hàn Quốc. Bốn người và ba bản dịch máy (Google Translate, chương trình dịch của Systran, và ứng dụng Papago của Naver) đã tham gia.
 
Ba (người) dịch đánh giá kết quả trên cơ sở tính chính xác, biểu hiện ngôn ngữ, logic và tổ chức. Trong khi máy dịch bốn tài liệu thử nghiệm nhanh hơn, con người đã thắng, với điểm số cao 49 trong số 60 điểm có thể. Điểm số máy cao nhất, đạt được của Google Translate, là 28. Sự tinh tế của diễn đạt và cảm xúc được nhấn mạnh đặc biệt là vượt quá tầm kiểm soát của máy móc.
 
Lợi thế của dịch máy
 
Chắc chắn dịch máy có những lợi thế nhất định. Một máy có thể dịch trong vài phút một cái gì đó mà một người sẽ mất vài giờ hoặc hơn. Cũng như tiết kiệm thời gian, tiết kiệm chi phí cho việc này cũng rất đáng kể.
 
Máy dịch chắc chắn có chỗ đứng của nó. Đối với các công ty có tài liệu dài, lặp đi lặp lại chỉ dành cho việc sử dụng nội bộ, dịch máy sẽ đủ cho nhiều lần. Điều này cũng áp dụng cho những người tìm kiếm để có được một sự hiểu biết cơ bản về các văn bản được viết bằng ngôn ngữ khác. Dịch máy có thể được sử dụng để dịch các tài liệu đó sang một tiêu chuẩn đủ cho người đọc bình thường.
 
Những bất lợi của dịch máy
 
Nhiều công ty mới bắt đầu sử dụng máy tính để dịch, đáp ứng nhu cầu của họ, nhanh chóng thấy rằng chất lượng của bản dịch chỉ đủ để hiểu biết sơ qua nội dung. Bản dịch được tạo ra từ máy móc không có đủ chất lượng cần thiết cho một tài liệu kinh doanh chuyên nghiệp.
 
Đây là nơi con người giữ được sự lãnh đạo của họ trên máy móc - con người tạo ra các bản dịch có chất lượng cao hơn so với máy móc. Đại học Sejong Cyber ​​đã xác nhận điều này chỉ cách đây vài tháng.
 
Điều này đặc biệt đúng với các cặp ngôn ngữ được dịch ít hơn và các ngôn ngữ khác biệt rất nhiều so với tiếng Anh, chẳng hạn như tiếng Ả Rập, tiếng Trung và tiếng Nhật.
 
Cũng có một thực tế là lỗi dịch máy có thể gây ra thiệt hại về danh tiếng và chính trị. Một số lỗi chính tả nhất của Google Translation cho đến nay bao gồm đề cập đến Liên bang Nga như là 'Mordor' trong tiếng Ukraina và dịch sai 'grelo' như là 'đòn bẩy' thay vì 'rau' khi quảng cáo thị trấn Galicia ở thị trấn As Pontes ' Hương vị lễ hội! '
 
Tương lai của dịch máy
 
Với những bước nhảy vọt gần đây về công nghệ dịch máy, rất có thể dự đoán rằng máy móc sẽ có thể dịch được một cách thành thục như con người chỉ trong vài năm. Tuy nhiên, dự báo tương tự đã được thực hiện trở lại trong những năm 1950 và vẫn chưa trở thành sự thật. Lịch sử đã cho chúng ta lý do để nghi ngờ khả năng của máy khi dịch, mặc dù sức mạnh đáng kinh ngạc của các hệ thống máy tính hiện đại. Việc dịch máy đã đi đến một chặng đường dài từ những năm 50, nhưng nó vẫn còn một chặng đường dài để đi trước khi nó có thể phù hợp với sự tinh tế về ngôn ngữ mà não của con người có thể mang lại. Cho đến thời điểm đó, nhóm chuyên gia ngoại ngữ đặc biệt của chúng tôi đang đứng đợi để cung cấp bản dịch các tài liệu của bạn ở mức chất lượng mà không có máy móc nào có thể sánh bằng.