So sánh sản phẩm
chọn tối đa 4 sản phẩm

Phương pháp chẩn đoán, mã hóa ngữ liệu

Ngày đăng:08:54:36 18-05-2016

1. Xử lý về chữ Hán (bao gồm cả dấu câu)

[C]:Mã biểu thị chữ sai, dùng để chú thích cho những chữ người học viết sai, thiếu nét hoặc không nhận biết được. Dùng [C] biểu thị chữ sai, trước [C] viết thêm chữ đúng, chữ hoàn chỉnh. Ví dụ地球[C]求(“求”是错字)

[B]:Mã biểu thị nhầm chữ, dùng để chú thích cho những trường hợp viết nhầm chữ nọ thành chữ kia. Lỗi nhầm chữ bao gồm chữ đồng âm, không đồng âm mà chỉ tương tự về hình thức, hoặc vừa không đồng âm, vừa không tương tự về hình thức nhưng lại là một chữ hoàn chỉnh. Chữ viết sai được đặt sau B, đồng thời phía trước viết thêm chữ đúng. Ví dụ: 提[B题]高、考虑[B虎]

[L]:Mã biểu thị thiếu chữ, dùng để chú thích những chỗ thiếu chữ cần có. Dùng [L] biểu thị chữ bị thiếu, trước [L] viết thêm chữ cần bổ sung. Ví dụ后悔[L],biểu thị chữ“悔” bị thiếu, 农[L]药,biểu thị chữ “农”bị thiếu, cần bổ sung.

[D]:Mã biểu thị thừa chữ, dùng để chú thích cho những chữ không cần xuất hiện trong câu. Chữ thừa được đặt sau [D]. Ví dụ我的[D的] biểu thị “的” trong ngoặc là một chữ thừa, vì câu nguyên bản xuất hiện cùng lúc hai chữ “的”.

[F]:Mã biểu thị chữ phồn thể, dùng để chú thích khi câu xuất hiện chữ phồn thể. Chữ phồn thể được đặt sau [F], trước [F] viết thêm chữ giản thể tương ứng. Ví dụ: 记忆[F憶]、单{F單}纯、养{F養}分{F份}.

Chú ý:

  1. Mã [F] được dùng để chú thích chữ phồn thể viết đúng, nếu chữ phồn thể này là một chữ nhầm lẫn với chữ khác thì trước hết cần dùng mã [F] để chú thích đây là chữ phồn thể, sau đó dùng mã [B] để chú thích lỗi nhầm chữ. Ví dụ俭朴[F樸[B僕]]

  2. Nếu chữ phồn thể viết sau thì kết hợp mã [F] và [C] để chú thích, ví dụ后[F後[C]].

[Y]:Mã chú thích chữ dị thể, được sử dụng để chú thích chữ dị thể. Đưa chữ dị thể vào trong [Y] và sau Y, đồng thời điền chữ giản thể vào trước [Y]. Ví dụ như: 偏[Y徧], 沉[Y沈].

[P]:Mã chú thích phiên âm, được dùng để chú thích hiện tượng sử dụng phiên âm thay cho chữ Hán. Đưa phiên âm vào trong [P] và sau P, đồng thời điền chữ giản thể vào trước [P]. Ví dụ như : 缘[Pyúan]分、保护[Phù].
[#]:Mã dùng để chú thích những chữ không thể nhận dạng được. Mỗi một chữ Hán không thể nhận dạng được sẽ được chú thích bằng một [#]. Ví dụ như: 更[#][#]保存自己的生命,……

[BC]:Mã được sử dụng để chú thích dấu câu sai. Đưa dấu câu sai vào trong [BC] và sau BC, đồng thời điền dấu câu đúng vào trước [BC]. Ví dụ như: 勤奋、[BC,]刻苦的精神。

[BQ]:Mã chú thích thiếu, dùng để chú thích hiện tượng cần sử dụng dấu câu nhưng không sử dụng. Thêm [BQ] vào chỗ thiếu dấu câu, đồng thời điền dấu câu bị thiếu vào trong [BQ] và sau BQ. Ví dụ như: 周围的环境很安静[BQ,]生活也非常平凡。

[BD]:Mã chú thích thừa, dùng để chú thích hiện tượng không cần sử dụng dấu câu nhưng lại có sử dụng. Đưa dấu câu thừa vào trong [BD] và sau BD. Ví dụ như: 我家周围的[BD,]美丽风景。

2 Xử lý từ (bao gồm cả thành ngữ)

{CC}:Mã chú thích từ sai, dùng để chú thích những chữ và thành ngữ bị sai. Bao gồm bốn trường hợp sau:

1)Viết sai thứ tự của các thành phần cấu tạo từ. Đưa từ bị viết sai vào trong {CC} và sau Từ Cường, đồng thời điền chữ viết đúng vào trước {CC}. Ví dụ như: 首先{CC先首}、众所周知{CC众所知周}。

2)Cần sử dụng từ A nhưng lại sử dụng từ B. Trường hợp này tương tự như lỗi sử dụng sai chữ, nhưng là lỗi sai về từ. Cách chú thích tương tự như trên. Ví dụ như: 虽然现在还没有实现{CC实践},……

3)Từ tự tạo ra. Để chỉ những từ do học sinh tự tạo ra hoặc những từ tồn tại trong một ngoại ngữ nào đó mà tiếng Hán không có. Ví dụ như: 农作物{CC农产物/农物}、农产品{CC农作品} .

4)Lỗi kết hợp từ ngữ (bao gồm cả lỗi kết hợp tính chất ngữ pháp của từ, âm tiết….Ví dụ như: 最好的办法是两个都保持{CC走去}平衡。

 {CLH}:Mã chú thích lỗi từ li hợp, dùng để chú thích các loại lỗi sai liên quan đến từ li hợp. Đánh dấu ở phía sau từ li hợp bị sử dụng sai, thể hiện cách sử dụng từ li hợp phía trước là sai. Ví dụ như: ……我快要毕业{CLH}大学{CQ了}。

{W}:Mã chú thíc từ nước ngoài, dùng để chú thích hiện tượng sử dụng từ nước ngoài thay cho từ tiếng Hán. Đưa từ tiếng nước ngoài vào trong {W} và sau W, đồng thời điền từ tiếng Hán tương ứng ở phía trước {W}. Ví dụ như: 非洲{W2Africa}、爵士乐{W3jazz}。

{CQ}:Mã chú thích từ thiếu, dùng để chú thích hiện tượng cần có một từ nào đó trong bài văn nhưng lại thiếu. Đánh dấu ở chỗ thiếu từ, đồng thời điền từ bị thiếu vào trong {CQ} và sau CQ. Ví dụ như: 这就{CQ要}由有关部门和政策管理制度来控制。

{CD}:Mã hiệu thừa từ, dùng để chú thích hiện tượng tronng bài văn không cần một từ nhưng lại xuất hiện từ đó. Đưa từ bị thừa vào trong {CD} và sau CD. Ví dụ như:  ……然后肯德基的收入有所增加{CD了}。

Khi xử lý từ cần chú ý các vấn đề sau:

1)Cấu trúc không hoàn chỉnh do thiếu hoặc thừa giới từ, từ phương vị…, sử dụng sai, thừa, thiếu trợ từ, dùng sai tính chất ngữ pháp của từ, đều được coi là lỗi về từ. Ví dụ như:

随着社会{CQ的}发展,人们{CQ对}吃的东西很重视。

在这个过程{CQ中}……

特别是非洲{CD的话},问题很大的。

2)Dùng nhầm các trợ từ cấu trúc “的” 、“地” 、“得”:Xử lý như lỗi về từ.  Ví dụ như:

按照人们的要求不用化肥和农药的话,产量会大大地{CC的}下降。

我认为当你很饿的时候,什么东西都吃得{CC的}下。

孩子们饿得{CC地}大哭小叫,……

3)Cần sử dụng chữ số trong tiếng Hán nhưng lại sử dụng chữ số la tinh, đều xử lý như lỗi về từ. Ví dụ như:

那应该怎样解决呢?所以我想出了一{CC1}个办法,少用化肥和农药。

4)Trong một mã hiệu chú thích có thể bao gồm hai từ hoặc hai từ trở lên. Ví dụ như:

我想任何人{CC每一个}都不要有浪费食品的习惯,……(每/一/个)

没有{CC2重视做未经}污染的食品就是绿色食品。(重视/做/未/经)

5)Số chữ của ngữ liệu ban đầu khác với sau khi sửa, cần phải thêm một con số Ả rập vào sau và sát với CC trong ngoặc, thể hiện số chữ sau khi sửa.

Ví dụ như:

战[Pzhan]争中最困难的人是没有力气的孩子和老人{CC5老弱子}。

所以我认为首先农民可以使用天然肥料{CC4化肥},代替化肥来种植农作物……

6)Những từ không rõ hoặc không thể hiểu được sử dụng {CY} để chú thích, thể hiện "còn nghi ngờ", đánh dấu ở phía sau từ đó. Ví dụ như:

虽然这么[L]多年都没见面{CLH}过,但我和他们的忆惯{CY},是忘不了的。

3 Xử lý câu

{CJ}:Mã hiệu dùng để chú thích câu có lỗi sai. Thường đánh dấu ở cuối câu, trước dấu câu đó, đồng thời dùng chữ cái phiên âm tiếng Hán viết thường để thể hiện loại hình lỗi sai của câu đó. Ví dụ như:

他把那本书看{CJba}。

我认为我们先尽量地[B的]产出农作物给他们,先给他们不挨饿{CJjy}。

如果有人批评这是太奢侈{CJxw},……

Các loại mã hiệu chú thích loại hình lỗi sai của câu:

{CJba} : Lỗi sai câu chữ 把

{CJbei} : Lỗi sai câu chữ 被

CJbi} : Lỗi sai câu chữ 比

{CJl} : Lỗi sai câu chữ 连

{CJy} : Lỗi sai câu chữ 有

{CJs} : Lỗi sai câu chữ 是

{CJsd} : Lỗi sai câu “是……的”

{CJcx} : Lỗi sai câu tồn hiện

{CJjy} : Lỗi sai câu kiêm ngữ 

{CJld} : Lỗi sai câu  liên động

{CJshb} : Lỗi sai câu  hai tân ngữ 

{CJxw} : Lỗi sai câu có vị ngữ là hình dung từ 

{CJ-} :Mã hiệu chú thích lỗi thiếu thành phần câu, dùng để chú thích những câu sai do thiếu thành phần câu. Đề rõ tên thành phần câu bị thiếu sau dấu gạch ngang, tên thành phần câu đó viết bằng mã hiệu viết thường; Điền từ ngữ cụ thể còn thiếu vào sau mã hiệu viết thường đó. Đánh dấu ở chỗ thiếu thành phần câu. Ví dụ như:

为了增加{CC满足}粮食,{CJ-zhuy人们}使用了化肥和农药,这样产量就会大大提高。

这样的活动{CJ-sy开展}以来,肯德基的垃[B拉]圾[C]总量大大降低。

……那两种{CC个}东西就容易伤害人类的{CJ-dy健康}系统。

从具体{CJ-zxy情况}来看,……

{CJ+} :Mã hiệu chú thích lỗi thừa thành phần câu, dùng để chú thích những câu sai do thừa thành phần câu. Đề rõ tên thành phần câu bị thừa bằng mã hiệu viết thường ở phía sau, đồng thời đưa từ ngữ cụ thể bị thừa ra phía sau tên thành phần câu đó. Đánh dấu ở chỗ thành phần câu bị thừa. Ví dụ như:

这是我们{CJ+dy做人}的责任。

而且研究{CJ+buy下去}产量能提高的办法。

而且{CJ+zy正在}还死去好多人。

Thành phần câu theo quan điểm phân tích tầng bậc, có tất cả 8 tám loại:

{CJ-/+zhuy} :Thừa hoặc thiếu chủ ngữ

{CJ-/+wy} :Thừa hoặc thiếu vị ngữ

{CJ-/+sy} :Thừa hoặc thiếu động từ hoặc tính từ chính trong vị ngữ

{CJ-/+by} :Thừa hoặc thiếu tân ngữ

{CJ-/+buy} :Thừa hoặc thiếu bổ ngữ

{CJ-/+dy} :Thừa hoặc thiếu định ngữ

{CJ-/+zy} :Thừa hoặc thiếu trạng ngữ

{CJ-/+zxy} :Thừa hoặc thiếu trung tâm ngữ

 

{CJX} :Mã hiệu chú thích lỗi trật tự từ, dùng để chú thích những câu sai do trật tự từ bị sai tạo thành. Đánh dấu ở phía sau từ bị sai trật tự. Nếu trật tự hai thành phần sát nhau bị sai, thì tuân theo trật tự tự nhiên, đánh dấu {CJX} ở phía sau thành phần phía trước. Ví dụ như:

大多数{CJX}这些人生活{CC2活}在很不好的地方,……

可是这两个问题同时{CJX}要解决非常不容易,……

现在每个人很重视健康,受欢迎{CJX}绿色食品。

{CJZR} :Mã hiệu chú thích mẫu câu hỗn tạp, dùng để chú thích câu sai do sử dụng lẫn hai mẫu câu khác nhau hoặc hai cách nói khác nhau. Đánh dấu ở cuối câu, trước dấu câu. Ví dụ như:

这个问题不可能一两年解决的问题{CJZR}。

现在,全世界流行是绿色食品{CJZR}。

每次吃对身体有害于健康的东西{CJZR}。

因为,人们的必生存之一中最重要的是饮食{CJZR},……

{CJcd} :Mã hiệu chú thích lỗi trùng điệp, dùng đề chú thích lỗi sai do từ ngữ trong câu bị trùng điệp sai, bao gồm lỗi về hình thức trung điệp, cũng bao gồm không cần trung điệp nhưng lại trùng điệp, hoặc cần phải trùng điệp nhưng không trùng điệp. Đánh dấu sau từ ngữ mắc lỗi trùng điệp. Ví dụ như:

而对生产者来说,尽量不用化肥和农药,在出货之前,进[C]行洗{CJcd}。

还有我们{CQ应}对绿色食品研究研究{CJcd}。
{CJgd} :Mã hiệu chú thích lỗi sai về hình thức cố định, dùng để chú thích lỗi sai khi kết hợp các hình thức cố định. Ví dụ như:

“一……就……” thiếu “一” hoặc “就”。

现代社会应当认“保护自己,尊重其他人”为口号{CJgd}!

{WWJ} :Mã hiệu chú thích câu chưa hoàn chỉnh, dùng để chú thích những câu chưa viết xong hoặc chỉ có một phần. Đánh dấu ở cuối câu. Ví dụ như:

只是全球{WWJ}

最后国家政府不考虑经济问题、积{WWJ}

不知道什么时候会普及起来,但是我认为这还是不是个{WWJ}

{CJ?} :Mã hiệu chú thích khi chưa rõ ràng trong xử lý câu, dùng để chú thích những câu sai không rõ thuộc loại hình nào hoặc rất khó chú thích loại hình hoặc không rõ nghĩa đồng thời có lỗi ngữ pháp. Đánh dấu ở cuối câu bị lỗi, trước dấu câu. Ví dụ như:

地球上,有的地方还在“饥饿”来艰苦{CJ?}。

还要想每个人的健康是帮助饥饿人的办法越来多健康的人会越来多帮饥饿的人{CJ?}。

把化肥可以取代{CC代取}用草、剩饭做的自然肥料{CJ?},把农药也可

取代{CC代取}喜欢吃害虫的动物{CJ?}。

 

Tags:
Tin cùng danh mục
Tin liên quan