Làm thế nào để dịch các dự án Mozilla?

Đầu tiên, chúng tôi rất hoan nghênh bạn vì bạn có nhã ý muốn tham gia dịch các dự án của Mozilla sang tiếng Việt. Hiện chúng ta đã có phiên bản Firefox và Thunderbird tiếng Việt, đó là sự nỗ lực rất lớn từ cộng đồng và nhất là bạn.

Để bắt đầu dịch, trước hết bạn phải vào trang dự án Narro (link tắt: http://bit.ly/dich-mozilla)

Nếu chưa có tài khoản Narro, bạn phải đăng ký trước. Nếu đã có tài khoản, bạn đăng nhập để bắt đầu tham gia dịch.

Có rất nhiều dự án cho bạn tham gia, để tham gia dịch dự án nào bạn hãy nhấp vào tên của nó. Bạn cũng nên chú ý đến thanh tiến trình: màu đỏ là có từ chưa dịch, màu vàng là đã được dịch nhưng chưa được thông qua, còn màu xanh tức là đã hoàn tất.

Sau khi nhấp vào tên dự án cần dịch, bạn sẽ thấy một chuỗi văn bản cần dịch hiện ra (trên nền xanh lá). Và bạn hãy ghi câu tiếng Việt trong mục Đề xuất của bạn, sau đó bấm vào Lưu.

Mẹo: Bạn có thể vừa lưu vừa chuyển đến câu tiếp theo bằng các nhấp vào Tiếp.

Lưu ý, nếu bạn muốn chuyển sang câu tiếp theo mà không muốn lưu lại câu vừa dịch của mình, bạn hãy xóa trống mục Đề xuất của bạn rồi sau đó bấm Tiếp.

Sử dụng RDF trong web ngữ nghĩa

Trước khi sử dụng các công cụ tìm kiếm ngữ nghĩa, thì các hệ thống ngữ nghĩa phải tổ chức lại những dữ liệu không có cấu trúc cụ thể trên internet. Vì những dữ liệu trên internet thường được viết bằng ngôn ngữ tự nhiên, và người dùng cũng thường tìm kiếm bằng một câu truy vấn theo ngôn ngữ tự nhiên. Việc xây dựng tự động các dữ liệu có cấu trúc thường mất một khoảng thời gian rất lớn, chi phí bỏ ra cũng nhiều.

Theo đề xuất của Zhang và Yu (xem [Zhang 2001]), một đồ thị ý niệm (Conceptual Graph – xem [Sowa 1984]) được dùng như là một công cụ cho việc hiện thực ngữ nghĩa (semantic representation), trong khi WordNet (xem [Miller 1990]) cùng với các hệ phân cấp quan hệ được xây dựng bằng cách thủ công tác động để hình thành miền ontology được dùng cho toàn bộ quá trình phân tích và khai thác ngữ nghĩa. Từ đó, những nghiên cứu khác sẽ ánh xạ và chuyển đổi một cách chính xác sang đồ thị RDF (xem [Berners-Lee 2001] và [Corby, Dieng, và Hèbert 2000]). (đọc tiếp…)

Tập trung vào ngữ cảnh của nội dung trong web ngữ nghĩa

Một trong các khó khăn của phân tích ngữ nghĩa mà ai cũng thấy đó là việc chuyển đổi các đại từ trong câu nói sang subject trong triple. Lấy một ví dụ, nếu như gặp chữ “tôi” trong blog của Kim Kha thì có thể subject là “Kim Kha”. Tuy nhiên, vì blog của Kim Kha cho phép bình luận nên Viết Nghi vào bình luận và thêm đại từ “tôi” vào trong đó, do đó, trong phần bình luận của Viết Nghi, chữ “tôi” được hiểu là “Viết Nghi”. Bây giờ, Viết Nghi có trích dẫn một câu nói của một người nào đó, rủi thay có đại từ “tôi”, và chúng tôi đoan chắc rằng máy không thể hiểu được subject là cái gì, bởi vì không có một mối liên hệ nào giữa từ “tôi” ở đây với một người đích danh nào đó (có một URI thích hợp).

Muốn giải quyết được vấn đề trên, cần phải tập trung vào ngữ cảnh của câu nói. Theo cách hiểu của con người, trong ngữ cảnh của câu trích dẫn, đại từ “tôi” được hiểu là “một ai đó mà người đó là tác giả của câu trích dẫn này”. Và vì tất cả các tài nguyên trên internet được xây dựng theo cách hiểu của con người, nên máy phải tìm cách hiểu những lối viết của con người, tức là phải hiểu dựa trên ngữ cảnh.

Quay trở lại vấn đề tìm kiếm, tương tự như phần phân tích ngữ nghĩa mà chúng ta vừa mới đề cập, một kết quả tốt là kết quả của sự “so trùng” ngữ nghĩa của câu truy vấn và dữ liệu, góc nhìn của ngữ cảnh cũng vậy. Máy tìm kiếm cần phải hiểu ngữ nghĩa trong ngữ cảnh truy vấn của người dùng, đồng thời phải hiểu ngữ nghĩa trong ngữ cảnh của các tài nguyên trong cơ sở dữ liệu tìm kiếm. (đọc tiếp…)

Phân tích ngữ nghĩa trang web

Trên internet, những tài nguyên, tài liệu thường đề cập về một chủ đề hoặc một khái niệm nào đó. Các khái niệm này đi kèm với định nghĩa mà con người có thể hiểu được. Dĩ nhiên, có những khái niệm, chủ đề yêu cầu người đọc phải có trình độ nhất định mới hiểu được. Vấn đề cơ sở nhất của tìm kiếm ngữ nghĩa là nằm ở đây: Máy có thể đọc và “hiểu” ý nghĩa của những khái niệm và chủ đề đó, để đưa ra kết quả theo ngữ nghĩa.

Ý tưởng của phân tích ngữ nghĩa đó là nếu các khái niệm, chủ đề trong cơ sở dữ liệu có thể “so trùng” với các khái niệm, chủ đề trong câu truy vấn, thì kết quả tìm được là tương đối tối ưu.

Theo phương án này, trước hết các tài nguyên cũng như câu truy vấn được phân tích ngữ nghĩa trước, sau đó sinh ra một tập các khái niệm. Với các tài nguyên, việc phân tích ngữ nghĩa được thực hiện ngay khi lập chỉ mục (index) rồi mới lưu vào CSDL, còn các câu truy vấn cũng phải được phân tích trong một thời gian ngắn khi người dùng gửi yêu cầu. Và việc còn lại của máy tìm kiếm là “so trùng” các khái niệm đó lại. “So trùng” ở đây được hiểu là sự so trùng về mặt từ vựng cũng như ngữ nghĩa của từ đó. (đọc tiếp…)

Sự ra đời của web ngữ nghĩa

“Chúng ta đang chìm ngập thông tin nhưng lại khát khao tri thức”

(John Naisbitt)

World Wide Web (WWW) chứa một thông tin khổng lồ, được tạo ra từ các tổ chức, cộng đồng khác nhau trên khắp thế giới. Nhờ vào WWW, kiến thức con người đã tăng tiến một cách đáng kể. Người ta ước tính, chỉ trong vòng vài chục năm, lượng kiến thức của nhân loại đã tăng gấp đôi. Tính đơn giản và phổ biến của WWW đã mang lại cho con người quá nhiều lợi ích. Con người có thể trao đổi thông tin ở khắp mọi nơi. Bạn chỉ cần một chiếc máy tính, kết nối Internet bằng nhiều cách, vào một trang web tìm kiếm và toàn thế giới sẽ hiện ra trước mắt bạn. (đọc tiếp…)

Vì sao Yahoo! 360 phải đóng cửa?

Hồi chiều ngồi nói chuyện với mấy đứa bạn, về Facebook, về Yahoo! và những công ty khác… Chợt nhớ đến bài học mang tên Yahoo 360.

yahoo360logoCó lẽ nhiều người trong chúng ta cũng còn ngỡ ngàng về sự ra đi đột ngột của dịch vụ blog từng làm mưa làm gió trên thế giới này… Có thể nói, chưa có một dịch vụ blog nào thành công nhiều như Yahoo!360, và cũng chưa có blog nào khiến cho người dùng “thương tiếc” nhiều như nó. Tất cả các trang báo chí, mọi kênh blog cá nhân, thậm chí trong những buổi trò chuyện thân mật người ta cũng đề cập đến… “bạn có chuyển nhà chưa?”

Đứng về góc nhìn vĩ mô mà nói, sự ra đi của một dịch vụ là chuyện bình thường… Nó phải ra đi để cho các khác đến và phát triển. Nhưng quả thật, sự ra đi nhanh chóng mặt của Yahoo!360 khiến mọi người đều bàng hoàng, tiếc nuối… À mà không, thực ra thì trước đó, khi dịch vụ này bị lỗi tràn lan, và người dùng chán nản… (đọc tiếp…)