TIN TỨC VÀ SỰ KIỆN - ĐẠI HỌC QUỐC GIA HÀ NỘI

  • Tài nguyên số
  • Thư viện
  • Văn bản
  • E-mail
  • Liên hệ
  • Sơ đồ Website
English
  • Trang nhất
  • Theo dòng lịch sử
  • ĐHQGHN - Dấu ấn trong tôi
  • Chân dung
  • Đô thị Hòa Lạc
  • Hình ảnh
  • Video
  • Văn hóa
  • Sinh viên
  • Phiên bản in - PDF
ĐHQGHN Tin tức & sự kiện Bản tin Tạp chí Khoa học Văn học Lăng kính sinh viên Giảng đường - Cuộc sống Blog' SV Nhịp cầu bè bạn Nhịp sống trẻ
Tin tức Thông báo Sau đại học 17:30:55 Ngày 02/12/2024 GMT+7
Thông tin LATS của NCS Nguyễn Thị Xuân Hương
Tên đề tài: Tích hợp đặc trưng ngôn ngữ vào mô hình học thống kê cho phân tích tình cảm

1. Họ và tên: Nguyễn Thị Xuân Hương                           2. Giới tính: Nữ

3. Ngày sinh: 03/02/1976                                                4. Nơi sinh: Hải Phòng  

5. Quyết định công nhận nghiên cứu sinh số: 1146, ngày 08 .tháng. 12 năm 2010  của Hiệu trưởng trường Đại học Công nghệ.

6. Các thay đổi trong quá trình đào tạo:

Đổi tên Luận án: “Nghiên cứu học máy thống kê cho phân tích quan điểm”, thời gian: 01/12/2012.

7. Tên đề tài luận án: Tích hợp đặc trưng ngôn ngữ vào mô hình học thống kê cho phân tích tình cảm.

8. Chuyên ngành: Khoa học máy tính                             9. Mã số: 62.48.01.01   

10. Cán bộ hướng dẫn khoa học: PGS. TS. Lê Anh Cường; PGS. TS. Nguyễn Lê Minh

11. Tóm tắt các kết quả mới của luận án:

- Phân tích và đề xuất các phương pháp trích chọn đặc trưng hữu ích làm dữ liệu vào cho các phương pháp học máy để phân loại bình luận chủ quan hay khách quan bằng tiếng Anh và tiếng Việt. Phương pháp thứ nhất được đề xuất là trích các đặc trưng ngôn ngữ dựa trên các mẫu ngữ pháp cho để phân loại tính chủ quan bằng phương pháp Maximum Entropy. Phương pháp được thử nghiệm trên bộ dữ liệu đánh giá phim ảnh bằng tiếng Anh, và kết quả thực hiện cho độ chính xác đạt tới 92.1%. Phương pháp thứ hai là học thống kê để trích các đặc trưng ngữ pháp thể hiện quan điểm dựa trên các mẫu được học một cách tự động và sử dụng các mẫu tốt nhất đã được học để trích các thông tin hữu ích làm đầu vào cho các thuật toán phân loại SVM và NB để xác định xem một bình luận cho thuộc về lớp chủ quan hay khách quan về các sản phẩm công nghệ được thu thập từ các trang sản phẩm và diễn đàn. Luận án cũng phân tích việc kết hợp các đặc trưng này với 1-gram, 2-gram để làm tăng độ chính xác của mô hình. Kết quả tốt nhất là 84,04% khi phân loại bình luận chủ quan bằng SVM.

- Đề xuất một mô hình tích hợp các đặc trưng giàu thông tin bên ngoài vào mô hình mạng nơ ron tích chập để làm tăng hiệu năng thực hiện cho mô hình trong đó sử dụng đặc trưng đầu vào là các véc tơ biểu diễn từ. Các đặc trưng này được trích xuất dựa vào TF-IDF của các từ loại là tính từ và động từ. Thử nghiệm phương pháp trên tập dữ liệu ABSA 2016 đã được gán nhãn các bình luận bằng tiếng Anh cho dữ liệu đánh giá nhà hàng. Kết quả của phương pháp có điểm F1 tốt nhất, tốt hơn nhiều so với một số mô hình nghiên cứu khác trước đó cho bài toán này được so sánh trên cùng bộ dữ liệu.

- Đề xuất hai phương pháp chuẩn hóa để tiền xử lý phù hợp cho dữ liệu Microblog tiếng Việt, phương pháp thứ nhất để kiểm tra chính tả sử dụng mô hình ngôn ngữ n-gram được huấn luyện từ kho ngữ liệu lớn, phương pháp thứ hai sử dụng hệ thống kiểm tra từ viết tắt và kiểm tra chính tả trong tách từ. Các phương pháp này đã được áp dụng cho dữ liệu quan điểm tiếng Việt dạng Microblog và kết quả thu được đã chứng minh chúng ảnh hưởng tốt đến độ chính xác của các phương pháp phân tích quan điểm. Các phương pháp này đã được áp dụng cho bước tiền xử lý dữ liệu quan điểm trong phân loại tính chủ quan cho dữ liệu Microblog tiếng Việt của chúng tôi.

12. Khả năng ứng dụng trong thực tiễn: Đề tài luận án có thể được áp dụng vào các hệ thống phân tích đánh giá ý kiến người dùng cho các sản phẩm, dịch vụ, v.v. trên thực tế. 13. Những hướng nghiên cứu tiếp theo: Nghiên cứu các phương pháp tích hợp các đặc trưng hữu ích khác và phát triển mô hình học hiệu quả cho phân tích tính chủ quan và phân tích tình cảm theo khía cạnh cho cả dữ liệu tiếng Anh và tiếng Việt.

14. Các công trình đã công bố có liên quan đến luận án:

2012, “Linguistic Features for Subjectivity Classification.”, In Proc. of the 6th International Conf. The International Conference on Asian Language Processing (IALP 2012), pp. 17-20.

2014, “Adapting Vietnamese Word Segmentation for Microblog-Style Data”, In In Proc., The Third Asian Conference on Information Systems, pp. 164-171.

2014, “Automatically Learning Patterns in Subjectivity Classification for Vietnamese”, In Proc. The Sixth International Conference on Knowledge and Systems Engineering (KSE 2014), pp. 675-690.

2014, “Using Large N-gram for Vietnamese Spell Checking”, In Proc. The Sixth International Conference on Knowledge and Systems Engineering (KSE 2014), pp. 655-674.

2018,  “Adding External Features to Convolutional Neural Network for Aspect-based Sentiment Analysis”, In In Proc. The 5th NAFOSTED Conference on Information and Computer Science (NICS), pp. 53-59

Phạm Minh Khuê
In bài viết Gửi cho bạn bè
Từ khóa :
Các bài mới hơn
  • Thông tin LATS của NCS Trần Hương Thục (29/11/2024)
  • Thông tin LATS của NCS Phan Hải (21/11/2024)
  • Thông tin LATS của NCS Nguyễn Thị Như Quỳnh (14/11/2024)
  • Thư mời quan tâm nhận thầu các gói thầu triển khai giai đoạn thực hiện đầu tư dự án “Đầu tư mua sắm trang thiết bị y tế - Dự án đầu tư xây dựng Tòa nhà trung tâm khoa khám bệnh và kỹ thuật nghiệp vụ - Bệnh viện Đại học Y Dược” (08/11/2024)
  • Cuộc thi An toàn thông tin quốc tế Moscow Capture the Flag 2024 (30/10/2024)
  • Thông tin LATS của NCS Quản Thị Hoàng Anh (24/10/2024)
  • Thông tin LATS của NCS Khúc Thị Trang Nhung (24/10/2024)
  • Thông tin LATS của NCS Vũ Xuân Mạnh (24/10/2024)
  • Chương trình học bổng và hỗ trợ từ “Gói hỗ trợ tài chính - Ươm mầm tài năng SHB” (22/10/2024)
  • Thông báo bảo vệ LATS của NCS Nguyễn Mạnh Tuấn (21/10/2024)
Các bài cũ hơn
  • Thông tin LATS của NCS Lương Thái Lê (19/12/2020)
  • Thông tin LATS của NCS Trịnh Thị Quý (19/12/2020)
  • Thông tin LATS của NCS Lâm Thị Huệ (17/12/2020)
  • Thông tin LATS của NCS Nguyễn Thị Hải (14/12/2020)
  • Thông báo bảo vệ LATS cấp Đại học Quốc gia của NCS Nguyễn Nhiên Hương (14/12/2020)
  • VNU và MB: Cùng triển khai các nội dung hợp tác song phương (09/12/2020)
  • Thông tin LATS của NCS Lương Xuân Trường (09/12/2020)
  • Thông báo bảo vệ LATS cấp ĐHQGHN của NCS Đinh Minh Thu (09/12/2020)
  • Thông báo bảo vệ LATS cấp ĐHQGHN của NCS Nguyễn Thị Thu Hồng (09/12/2020)
  • Thông báo bảo vệ LATS cấp ĐHQGHN của NCS Phùng Thị Thu Trang (09/12/2020)
Xem tin bài theo thời gian :
Bản tin ĐHQGHN (số 393) | PDF
Tìm số báo Bản tin ĐHQGHN (số 393) Bản tin ĐHQGHN số 392 Bản tin ĐHQGHN số 390 Bản tin ĐHQGHN số 389 Bản tin ĐHQGHN số 388 Bản tin ĐHQGHN số 387 Bản tin số 386 (02/2024) Bản tin số 385 (Số đặc biệt Tết Giáp Thìn) Bản tin số 384 (tháng 12/2023) Bản tin số 383 (tháng 11/2023) Bản tin số 382 (tháng 10/2023) Bản tin số 381 (tháng 09/2023) Bản tin số 380 (tháng 08/2023) Bản tin số 379 (07/2023) Bản tin số 378 (06/2023) Bản tin số 377 (05/2023) Bản tin số 376 (04/2023) Bản tin số 375 (03/2023) Bản tin số 374 (02/2023) Bản tin số 372 (12/2022) Bản tin số 371 (11/2022) Bản tin số 373 (01/2023) Bản tin số 370 (10/2022) Bản tin số 368 (08/2022) Bản tin số 369 (09/2022) Bản tin số 367 (07/2022) Bản tin số 366 (06/2022) Bản tin số 365 (05/2022) Bản tin số 364 (04/2022) Bản tin số 363 (03/2022) Bản tin số 362 (02/2022) Bản tin số 361 (Số Tết 2022) Bản tin số 360 (2021) Bản tin số 359 (2021) Bản tin số 358 (2021) Bản tin số 339 (2019) Bản tin số 345-346 (2019) Bản tin số 342 (2019) Bản tin số 338 (2019) Bản tin số 337 (2019) Bản tin số 335-336 (2019) Bản tin số 334 (2018) Bản tin số 331 (2018) Bản tin số 327 (2018) Bản tin số 326 (2018) Bản tin số 324 (2018) Bản tin số 321 (2017) Bản tin số 320 (2017) Bản tin số 319 (2017) Bản tin số 316 (2017) Bản tin số 301 (2016) Bản tin số 300 (2016) Bản tin số 292+293 (2015) Ban tin số 300 (2016) Bản tin số 298+299(2016) Bản tin số 291 (2015) Bản tin 290 (2015) Bản tin số 266 (4/2013) Bản tin số 265 (3/2013) Bản tin số 264 (2/2013) Bản tin ĐHQGHN số 262 + 263 (2013) Số đặc biệt Xuân Quý Tỵ Bản tin số 261 (11/2012) Bản tin số 260 (10/2012) Bản tin số 259 (09/2012) Bản tin số 258 (08/2012) Bản tin số 257 (07/2012) Bản tin số 256 (06/2012) Bản tin số 255 (05/2012) Bản tin số 254 (04/2012) Bản tin số 253 (03/2012) Bản tin số 252 (02/2012) Bản tin số 250 (12/2011) và 251 (1/2012) Bản tin số 249 (11/2011) Bản tin số 248 (10/2011) Bản tin số 247 (9/2011) Bản tin số 246 (8/2011) Bản tin số 245 (7/2011) Bản tin số 244 (6/2011) Bản tin số 243 (5/2011) Bản tin số 242 (4/2011) Bản tin số 241 (3/2011) Bản tin số 240 (2/2011) Bản tin số 239 (1/2011) Bản tin số 238 (12/2010) Bản tin số 237 (11/2010) Bản tin số 236 (10/2010) Bản tin số 235 (9/2010) Bản tin số 234 (8/2010) Bản tin số 233 (7/2010) Bản tin số 232 (6/2010) Bản tin số 231 (5/2010) Bản tin số 230 (4/2010) Bản tin số 229 (3/2010) Bản tin số 228 (2/2010) Bản tin số 227 (1/2010) Bản tin số 226 (12/2009) Bản tin số 225 (11/2009) Bản tin số 224 (10/2009) Bản tin số 223 (9/2009) Bản tin số 222 (8/2009) Bản tin số 221 (7/2009) Bản tin số 220 (6/2009) Bản tin số 219 Bản tin số 218 Bản tin số 217 Bản tin số 216 Bản tin số 215 Bản tin số 214 Bản tin số 213 Bản tin số 212 Bản tin số 211 Bản tin số 210 Bản tin số 209 Bản tin số 208 Bản tin số 207 Bản tin số 206 Bản tin số 205 Bản tin Số 204 Bản tin số 203 - Tết Mậu Tý 2008 Bản tin ĐHQGHN số 202 Bản tin ĐHQGHN - Số 201 Bản tin số 200 Bản tin số 199 Bản tin số 295 (2015)
TIN BÀI XEM NHIỀU NHẤT
  • Vài suy nghĩ về giáo dục và đào tạo phục vụ cho phát triển
  • 10 sự kiện nổi bật của ĐHQGHN năm 2011
  • 10 thành tựu nổi bật của ĐHQGHN năm 2011
  • Nguồn gốc ý nghĩa từ Cát-xê
  • Tự chủ đại học: Xu thế của phát triển
  • Học vị tiến sĩ cũng lắm gian nan
  • Học sinh ngày càng chán học môn lịch sử
  • 9 nguyên tắc “vàng” trong giảng dạy đại học
  • Có chí thì nên
  • Cần đổi mới cơ bản công tác quản lý giáo dục
TRÊN WEBSITE KHÁC

Trang diễn đàn | Diễn đàn Học sinh - Sinh viên | Diễn đàn Đoàn Thanh niên cộng sản Hồ Chí Minh | Diễn đàn Phụ huynh Học sinh - Sinh viên

Copyright ®2010, ĐẠI HỌC QUỐC GIA HÀ NỘI - 144 Đường Xuân Thủy,QuậnCầu Giấy, Hà Nội, Việt Nam, Điều khoản sử dụng | Bản quyền khiếu nại

Từ khóa » Tách Từ N-gram