Hàng năm, các hoạt động học thuật diễn ra hỗ trợ sinh viên trường đại học Công Thương nói chung và khoa Công nghệ thông tin nói riêng vừa giúp sinh viên các kỹ năng học tập hiện tại cũng như kỹ năng nghề nghiệp trong tương lai. Trong buổi seminar cuối tháng 10 năm 2025, chủ đề nóng và hấp dẫn được bộ môn hệ thống thông tin đưa ra chính là đồ thị tri thức do diễn giả Nguyễn Hồng Bửu Long trình bày.
TẦM QUAN TRỌNG CỦA ĐỒ THỊ TRI THỨC
Cơ sở tri thức là một khái niệm mới khác với khái niệm cơ sở dữ liệu kinh điển. Cơ sở tri thức là một kho lưu trữ kỹ thuật số, tập trung, được tổ chức có hệ thống, chứa đựng thông tin, tài nguyên, tài liệu, và các quy tắc suy luận về một lĩnh vực cụ thể hoặc một tổ chức. Trong khi đó, cơ sở dữ liệu nhắm đến việc lưu trữ dữ liệu có cấu trúc, thường có cấu trúc bảng (quan hệ) cố định và chặt chẽ nhằm truy xuất dữ liệu theo truy vấn mà không có khả năng suy luận, học hỏi và đưa ra giải pháp mới dựa trên các quy tắc.
Mục đích chính của cơ sở tri thức là cho phép người dùng dễ dàng tìm kiếm thông tin, tự giải quyết vấn đề (tự phục vụ), và cải thiện hiệu quả hoạt động bằng cách tập trung hóa và chuẩn hóa tri thức. Ở đây con người cần mang tri thức vào đồ thị, sử dụng công cụ xử lý ngôn ngữ tự nhiên trong việc xây dựng đồ thị tri thức (Knowledge Graph - KG), khác với xử lý ngôn ngữ con người. Chữ viết là nhân tạo còn ngôn ngữ là tự nhiên. Bản chất của ngôn ngữ tự nhiên rất khó xử lý. Một trong những ứng dụng xử lý ngôn ngữ tự nhiên phổ biến hiện này mà sinh viên vẫn hay sử dụng là ChatGPT, Gemini…. Câu chuyện hiện nay là làm sao cho máy tính hiểu được ngôn ngữ tự nhiên của con người nhưng vấn đề lớn hiện nay gặp phải ở các ứng dụng là trả lời sai vì kiến thức được huấn luyện không có cấu trúc và không giải thích được các kiến thức đó.
Để giải quyết bài toán này người ta dùng đến đồ thị tri thức (Knowledge Graph). Khi đó, AI giải thích được dựa trên các mô hình này. Google translate là một trong những công cụ gần gũi nhất. Các tình huống có thể diễn ra là thực thể không có trong tập huấn luyện, từ cần tìm ít xuất hiện trong tập huấn luyện, nhập nhằng dịch thuật ngữ như “sở thú nhận nuôi một con hổ”. Câu này có thể hiểu theo nghĩa “sở thú nhận nuôi một con hổ” hoặc “sở thú nhận nuôi một con hổ”.

Đồ thị tri thức là một mô hình dữ liệu mạnh mẽ được thiết kế để biểu diễn, tổ chức và kết nối thông tin dưới dạng một mạng lưới có cấu trúc. Đồ thị tri thức giúp máy tính giải thích được các dữ liệu dựa vào các đường đi cho nên việc xây dựng đồ thị tri thức khá phức tạp. Đồ thị tri thức không phải chỉ có đơn thuần là văn bản mà còn rất nhiều kiểu như bảng biểu, trang web, hình ảnh. ..Ta hoàn toàn chủ động có thể thêm mới hoặc bỏ bớt các tri thức mình mong muốn.

ỨNG DỤNG THỰC TIỄN
Một số Knowledge Graph phổ biến như Yago, Wikidata, Dppedia… Thách thức hiện nay là các đồ thi tri thức không đầy đủ, đồ thị còn thiếu hoặc đồ thị tri thức phát triển ngày càng lớn. Các mô hình ngôn ngữ hiện nay hoặc các mô hình mã nguồn mở đều học và dự đoán từ tiếp theo nhưng không học được cấu trúc tường minh. Đồ thị tri thức sẽ đem lại ngữ cảnh cho tri thức. Trong các bài toán machine learning, đồ thị tri thức giúp ta trích xuất các đặc trưng và đưa ra kết quả mô hình. Mô hình trí tuệ nhân tạo được giải thích qua nhiều bước, kết quả sẽ cho ra có độ tin cậy cao hơn. Một số ứng dụng thực tiễn như:
1. Công cụ tìm kiếm và Trợ lý ảo
Đây có lẽ là ứng dụng nổi tiếng nhất, được Google tiên phong phát triển với "Google Knowledge Graph" giúp người dùng
Tìm kiếm ngữ cảnh: Khi người dùng tìm kiếm một thực thể (ví dụ: tên một người nổi tiếng), Google không chỉ hiển thị các liên kết website mà còn hiển thị một bảng tóm tắt thông tin chi tiết (ngày sinh, sự nghiệp, các tác phẩm liên quan...) nhờ vào việc truy vấn đồ thị tri thức.
Trợ lý ảo thông minh: Các trợ lý ảo như Siri, Alexa hay Google Assistant sử dụng KG để hiểu ngữ cảnh của câu hỏi tự nhiên (Natural Language Processing - NLP) và đưa ra câu trả lời chính xác, phù hợp hơn (ví dụ: "Thời tiết ở Hà Nội hôm nay thế nào?" thay vì chỉ tìm kiếm từ khóa).
2. Thương mại điện tử và hệ thống gợi ý
Các nền tảng bán hàng trực tuyến sử dụng KG để mang lại trải nghiệm cá nhân hóa và tối ưu hóa doanh số bán hàng:
Gợi ý sản phẩm chính xác: Bằng cách hiểu mối quan hệ giữa các sản phẩm, người dùng, sở thích và lịch sử mua hàng, KG có thể đề xuất các sản phẩm liên quan một cách thông minh (ví dụ: nếu bạn mua giày leo núi, hệ thống sẽ gợi ý với leo núi hoặc ba lô).
Tối ưu hóa tìm kiếm sản phẩm: Giúp khách hàng tìm kiếm sản phẩm dễ dàng hơn, ngay cả khi sử dụng các truy vấn phức tạp hoặc ngôn ngữ tự nhiên.
3. Y tế và Chăm sóc sức khỏe
KG đóng vai trò quan trọng trong việc tích hợp lượng dữ liệu y tế khổng lồ từ các nguồn khác nhau:
Hỗ trợ chẩn đoán lâm sàng: Kết nối dữ liệu bệnh nhân, triệu chứng, bệnh sử, kết quả xét nghiệm, và các tài liệu nghiên cứu y học để giúp bác sĩ đưa ra quyết định chẩn đoán và điều trị chính xác hơn.
Nghiên cứu thuốc và phát hiện tương tác thuốc: KG có thể liên kết dữ liệu gen, kết quả thử nghiệm lâm sàng và các hợp chất hóa học để xác định các loại thuốc tiềm năng hoặc dự đoán các phản ứng phụ không mong muốn.
Ngoài ra còn nhiều lĩnh vực mà KG đã tham gia vào như Tài chính và Phát hiện gian lận, Quản lý tri thức doanh nghiệp, Tối ưu hóa chuỗi cung ứng và Sản xuất
THẢO LUẬN SÔI NỔI VÀ ĐỊNH HƯỚNG TƯƠNG LAI
Phần hỏi đáp và thảo luận diễn ra rất sôi nổi, cho thấy sự quan tâm lớn của người tham dự đối với chủ đề này. Có khá nhiều câu hỏi hay hoặc hóc búa dành cho diễn giảng Nguyễn Hồng Bửu Long đề cập đến vấn đề nhận dạng ảnh bằng KG, các giải pháp xử lý model, truy vấn các bảng báo giao thông phản hồi tức thời cho người dùng… làm cho buổi seminar nóng lên và hấp dẫn hơn
Buổi seminar đã thành công trong việc truyền cảm hứng và trang bị những kiến thức nền tảng cần thiết cho sinh viên, mở ra những hướng đi mới trong việc khai thác tối đa giá trị của dữ liệu trong tương lai.


Ban truyền thông FIT.HUIT