Thành viên:Plantaest/Cải thiện chức năng chú thích

Cải thiện chức năng chú thích là dự án nhằm giúp chức năng chú thích hoạt động chính xác hơn đối với các nguồn tiếng Việt.

Bối cảnh

sửa

Chức năng chú thích của trình soạn thảo trực quan được bật chế độ tự động vào giữa năm 2021. Từ đó, việc chú thích trở nên dễ dàng hơn khi chỉ cần điền một URL, và sinh được ngay bản mẫu chú thích với các thông tin được điền sẵn.

Tuy nhiên, kể từ khi kích hoạt khả năng chú thích tự động, đã dẫn đến rất nhiều chú thích được tạo ra một cách không chính xác về mặt định dạng, điển hình là sai tên tác giả. Ví dụ như mục Tham khảo ở bài Mr. Siro, chú thích của báo Tuổi trẻ có tên tác giả là "ONLINE, TUOI TRE"; hay báo Thanh niên có tên tác giả là "thanhnien.vn". Các lỗi định dạng như vậy là không hợp lý, cần được sửa theo tên tác giả đúng của bài báo. Tất nhiên, không chỉ tên tác giả, mà còn nhiều trường thông tin khác cũng bị lỗi, như tên nhà xuất bản, thời điểm xuất bản.

Giải pháp

sửa

Nhìn chung, về mặt kỹ thuật có một số hướng để giải quyết vấn đề này. Một là xử lý ở phía Zotero, nơi lưu trữ các translator dùng để cấu hình định dạng cho chú thích của từng website riêng biệt, những cấu hình này sẽ được Citoid (chức năng chú thích của trình soạn thảo trực quan) sử dụng. Hai là dùng giải pháp Web2Cit, cần tìm hiểu kỹ để tích hợp một cách hợp lý. Các phương án sẽ được thử nghiệm để chọn ra đường hướng tốt nhất trong khả năng.

Mỗi một website sẽ cần được cấu hình định dạng cho phù hợp với các trường của bản mẫu chú thích, và có thể có các bài kiểm thử để đảm bảo hoạt động chính xác. Vì vậy, công việc này tương đối tốn thời gian và công sức nếu cần thực hiện cho một số lượng lớn nguồn.

Khi đã có được các cấu hình định dạng, thì không chỉ trình soạn thảo trực quan được hưởng lợi, mà có thể dùng cho trình sửa mã nguồn, hoặc dùng cho bot để nó có thể điều chỉnh các chú thích nguồn tiếng Việt có định dạng hợp lý. Từ đó, chỉ cần một URL, có thể tạo ra mã chú thích hoàn chỉnh với các trường được điền thông tin chính xác.

Danh mục nguồn

sửa

Dự án chỉ thực hiện cấu hình định dạng cho các nguồn tiếng Việt, vì hiện nay, các nguồn nhóm này ít được Zotero hỗ trợ, dẫn đến chú thích từ chúng hay bị sai định dạng.

Dự kiến có khoảng 80 nguồn được xử lý đầu tiên, vì khoảng thời gian thực hiện dự án có thể là 3 tháng, ưu tiên các nguồn được sử dụng nhiều ở các bài viết.

Dưới đây là danh sách các nguồn cần được quan tâm trong dự án này (đang cập nhật).

  1. thanhnien.vn
  2. tuoitre.vn
  3. dantri.com.vn
  4. vnexpress.net
  5. tienphong.vn
  6. hoahoctro.tienphong.vn
  7. vov.vn
  8. vtv.vn
  9. nld.com.vn
  10. laodong.vn
  11. hanoimoi.vn
  12. anninhthudo.vn
  13. nguoihanoi.vn
  14. congluan.vn
  15. daidoanket.vn
  16. sggp.org.vn
  17. vtcnews.vn
  18. danviet.vn
  19. vietnamnet.vn
  20. vietnamplus.vn
  21. vannghequandoi.com.vn
  22. phunuonline.com.vn
  23. phunuvietnam.vn
  24. suckhoedoisong.vn
  25. thethaovanhoa.vn
  26. baophapluat.vn
  27. cand.com.vn
  28. plo.vn
  29. antv.gov.vn
  30. thanhtravietnam.vn
  31. baotintuc.vn
  32. baovanhoa.vn
  33. kinhtedothi.vn
  34. giaoducthoidai.vn
  35. toquoc.vn
  36. bazaarvietnam.vn
  37. dangcongsan.vn
  38. laodongthudo.vn
  39. congthuong.vn
  40. nguoiduatin.vn
  41. nhandan.vn
  42. qdnd.vn
  43. daibieunhandan.vn
  44. thesaigontimes.vn
  45. congly.vn
  46. arttimes.vn
  47. mensfolio.vn
  48. dep.com.vn
  49. elle.vn
  50. elleman.vn
  51. lofficielvietnam.com
  52. forbes.vn
  53. 1thegioi.vn
  54. thegioidienanh.vn
  55. voh.com.vn
  56. vneconomy.vn
  57. znews.vn
  58. baochinhphu.vn
  59. giacngo.vn
  60. nongnghiep.vn
  61. tapchicongsan.org.vn
  62. vnanet.vn
  63. tiasang.com.vn
  64. baoquocte.vn
  65. voatiengviet.com
  66. bbc.com/vietnamese
  67. rfa.org/vietnamese
  68. rfi.fr/vi
  69. nguoi-viet.com
  70. tiin.vn
  71. doisongphapluat.com.vn
  72. viez.vn
  73. yeah1.com
  74. gamek.vn
  75. mattran.org.vn
  76. quochoi.vn
  77. moj.gov.vn
  78. tapchicongthuong.vn
  79. thoibaotaichinhvietnam.vn

Danh mục dự bị

sửa

Có thể điền một số nguồn khác tại đây, vì nếu một nguồn nào đó trong danh sách chính không viết được cấu hình vì những lý do khách quan, thì sẽ lấy đến các nguồn trong danh sách này; hoặc dùng cho các đợt sau này. Danh mục này không có giới hạn về số lượng.

  1. baokhanhhoa.vn
  2. kiemsat.vn
  3. kinhtechungkhoan.vn
  4. thoibaonganhang.vn
  5. baovephapluat.vn
  6. danchuphapluat.vn
  7. bnews.vn

Xem thêm

sửa