Nhiều sinh viên Trường ĐH Công nghệ thông tin (ĐH Quốc gia TP.HCM) có bài báo khoa học được đăng tải trên các tạp chí, hội nghị khoa học quốc tế tại Nhật, Mexico…
Đáng chú ý, các nhóm sinh viên đều là tác giả chính, đứng tên đầu trong nhóm tác giả bài báo. Giảng viên chỉ đồng hành, hướng dẫn và tiếp sức cho các nhóm trong quá trình nghiên cứu và công bố bài báo khoa học.
Việt hóa dữ liệu
Bài báo “Sentence Extraction-Based Machine Reading Comprehension for Vietnamese” (Đọc hiểu tự động dựa trên trích xuất cấp độ câu trong văn bản tiếng Việt) của nhóm tác giả Đỗ Nguyễn Thuận Phong và Nguyễn Duy Nhật (sinh viên năm 3 khoa khoa học máy tính) đã được chấp nhận tại hội nghị quốc tế lần thứ 14 Knowledge Science, Engineering and Management (KSEM 2021) sẽ diễn ra tại Tokyo, Nhật Bản tháng 8-2021.
Chia sẻ về nội dung bài báo, Đỗ Nguyễn Thuận Phong cho hay trong bài báo, nhóm nghiên cứu đã tạo ra bộ dữ liệu UIT-ViWikiQA từ việc chuyển đổi bộ dữ liệu UIT-ViQuAD bằng thuật toán do nhóm phát triển.
So với tiền thân của nó, đây là bộ dữ liệu trích xuất câu dựa trên đọc hiểu tự động thay vì truy xuất ra cụm. Việc truy xuất câu cũng sẽ giúp cho người đọc nhận được một thông tin nhiều hơn và thuận tiện sử dụng làm đầu vào cho các bài toán sau đó.
Hai nữ sinh viên năm 3 ngành công nghệ thông tin, gồm Nguyễn Thị Hồng Nhung và Hà Phan Diệu Phương, cũng vừa nhận tin bài báo khoa học của nhóm đã được chấp nhận đăng tải tại hội nghị quốc tế lần thứ 20 Intelligent Software Methodologies, Tools and Techniques (SOMET 2021) sẽ được tổ chức tại Cancun, Quintana Roo, Mexico vào tháng 9-2021.
Bài báo “Vietnamese Open-domain Complaint Detection in E-Commerce Websites” (Tự động phát hiện các phàn nàn bằng tiếng Việt trên các trang web thương mại điện tử) của hai nữ sinh viên này thực hiện dưới sự hướng dẫn của ba giảng viên.
“Chúng tôi tiến hành xây dựng bộ dữ liệu phàn nàn tiếng Việt phục vụ cho bài toán nhận diện phàn nàn. Bộ dữ liệu đã xây dựng (UIT-ViOCD) bao gồm 5.485 đánh giá đã được gán nhãn, trên bốn lĩnh vực được thu thập từ trang thương mại điện tử.
Ngoài ra, chúng tôi cũng đã làm nhiều thí nghiệm đánh giá tầm quan trọng của các thành phần cấu trúc ngôn ngữ tiếng Việt trong bài toán nhận diện phàn nàn. Trong tương lai, chúng tôi sẽ xây dựng một hệ thống nhận diện phàn nàn tự động trên các trang web thương mại điện tử” – Hồng Nhung chia sẻ về nội dung bài báo khoa học của nhóm.
Nhóm bạn thân là đồng tác giả
Nhóm bạn thân cùng khóa 2018 gồm: Trần Quốc Khánh, Trịnh Ngọc Pháp, Trần Nguyễn Anh Khoa, Lê Trần Hoài Ân, Hà Văn Luân đều là những người trẻ yêu thích hoạt động xã hội, công ích cộng đồng và đam mê nghiên cứu khoa học từ sớm.
Trần Quốc Khánh cho biết bài báo chung của nhóm được chấp nhận đăng tại hội nghị quốc tế SOMET 2021. Đây là thành quả đạt được của những người bạn chung đam mê, cùng với sự hướng dẫn và giúp đỡ tận tình của thầy Nguyễn Văn Kiệt.
Theo các tác giả sinh viên, trong bài báo đăng tại SOMET 2021, nhóm xây dựng bộ dữ liệu UIT – ViON (Vietnamese Online Newspaper) được thu thập từ các trang báo điện tử nổi tiếng của Việt Nam. Nhóm xử lý, tạo bộ dữ liệu, sau đó thử nghiệm và đánh giá nó bằng cách sử dụng các loại mô hình máy học khác nhau.
Tương tự, bài báo khoa học “SA2SL: From Adpect-Based Sentiment Analysis to Social Listening System for Business Intelligence” (SA2SL: Từ phân tích cảm xúc dựa trên khía cạnh đến hệ thống lắng nghe xã hội cho kinh doanh thông minh) của nhóm sinh viên năm 3 ngành khoa học dữ liệu, gồm Phan Lực Lượng, Phạm Huỳnh Phúc, Nguyễn Thị Thanh Kim, Nguyễn Thị Thắm và Huỳnh Khải Siếu cũng đã được chấp nhận đăng tại KSEM 2021.
Phan Lực Lượng cho hay: “Bài báo này được nhóm chúng tôi thực hiện với sự hướng dẫn của ba giảng viên. Thực sự may mắn khi những kết quả nghiên cứu ban đầu của nhóm đã được đăng tại hội nghị KSEM. Đây chính là động lực rất lớn thúc đẩy chúng tôi tiếp tục các nghiên cứu và thử nghiệm tiếp theo”.
Sinh viên là tác giả chính
Theo TS Nguyễn Lưu Thùy Ngân – phó hiệu trưởng Trường ĐH Công nghệ thông tin, KSEM 2021 là hội nghị khoa học quốc tế về khoa học, kỹ thuật và quản lý tri thức được tổ chức lần thứ 14, thu hút nhiều báo cáo nghiên cứu có chất lượng từ khắp nơi trên thế giới. Còn hội nghị khoa học SOMET 2021 là diễn đàn của những ý tưởng, giải pháp thúc đẩy các hướng đi mới trong lĩnh vực phát triển phần mềm. Những bài báo khoa học trên đều có tác giả chính là sinh viên, được thực hiện dưới sự hướng dẫn của các giảng viên của trường.