+تېما يوللاش
شەرەر يوللانغان ۋاقتى:2017-4-27 00:33 14931 قېتىم كۆرۈلدى 33 ئىنكاس يېزىلدى
مەلۇم قەۋەتكە يۆتكىلىش
ئۇيغۇرچە OCR ھەققىدە مېنىڭ تەجرىبىلىرىم (1)

ئاپتۇرى: Mars36

كىرىش سۆز

OCR تېمىسى  كۆپ قېتىم قىزىق باشلىنىپ سوغۇق ياكى نەتىجىسىز ئاخىرلاشقان ئىدى… مەنمۇ تەكرار ئويلاندىم، يازماي دېدىم. نېمىشقا؟
1. بۇ تېما باشقا ئادەتتىكى پىروگرامما لايىھەلەشتەك ئاددىي ئىش بولمىغاچقا بىلگەنلەر ئالدىراشلىق ياكى ئىچى تارلىق (بۇ-كۆپ ساندىكى ئۇيغۇر كومپيۇتېرچىلىرىمىزدا مەۋجۇت بولغان ئۆز مەنپەئەتىنى قوغداش نامىدىكى چىدىماسلىق، دەپ بىلىمەن. ئەمەلىيەتتە تەجرىبىنى ئايىمايمۇ نان تېپىپ يېگىلى بولىدۇ) سەۋەبىدىن، بىلمىگەنلەر چۈشەنمىگەنلىكتىن پىكىر قاتناشتۇرماسلىق بىلەن نەتىجىسىز قېلىشى مۇمكىن.
2. بۇنى مەنمۇ تولۇق ئەمەلگە ئاشۇرۇپ بولالمىغاچقا مۇكەممەل بولمىغان تەجرىبىنى داستىخانغا چىقارماي دېگەن ئىدىم. ئۇنىڭ ئۈستىگە مەندىن تەجرىبىلىك، بىلىملىك، مەخسۇس كەسىپتە ئوقۇغان (مەن ئالىي مەكتەپنى رەسىم كەسپىدە پۈتتۈرگەن، كومپيۇتېر ۋە پىروگرامما لايىھەلەشنى ئۆزلۈكۈمدىن ئۆگەنگەن، ئۇستازىم يوق)، دىپلومى يوغان ۋە كۆپ ئۇستاملار بىزدە نۇرغۇن تۇرسا ماڭا سۆزلەپ نېمە كەپتۇ، دەپ ئويلىغان يېرىممۇ بار.
ئەمما بىر نەچچەيلەننىڭ تەكرار تەكلىپى بىلەن كۆپچىلىك ئورتاق تىرىشىپ باقساق بەلكىم نەتىجىسى چىقىپ قېلىشىمۇ مۇمكىن، دېگەن ئۈمىدتە يەنىلا بۇنى يېزىپ ئولتۇرۇپتىمەن.
خوش، ئەسلىي تېمىغا كېلەيلى (ناۋادا ئىزاھات بېرىلمىسە تېمىدىكى OCR پۈتۈنلەي ئۇيغۇر يېزىقىغا قارىتىلغان).
تۆۋەندىكى مەزمۇنلار توغرىلىق تەكرار توختالمايمىز:
1. OCRنىڭ نېمىلىكى، ھازىرقى ئەھۋالى ۋە ئۇيغۇر يېزىقىغا مۇناسىۋەتلىك OCRنىڭ تەرەققىياتى؛
2. كومپيۇتېردا رەسىم بىر تەرەپ قىلىشقا مۇناسىۋەتلىك مۇھىم ماتېماتىكىلىق ئۇقۇملار (كوردىنات، نۇقتا، سىزىق…).
ناۋادا يېڭى ئۆگەنگۈچى بولسىڭىز يۇقىرىقى مەزمۇنلار توغرىلىق چۈشەنچىگە ئىگە بولۇش ئۈچۈن تۆۋەندىكى ئادرېسلارغا مەرھەمەت (يازما بىر يىل ئىلگىرى دەسلەپكى قەدەمدە يېزىلغان، بەزى ئۇلانمىلار ئېچىلماسلىقى مۇمكىن):
http://www.aliptori.com/forum.php?mod=viewthread&tid=29865

OCR ئېنگىلىزچە Optical Character Recognition دېگەن سۆزنىڭ قىسقارتىلمىسى بولۇپ، خەت بويچە تەرجىمە قىلسا ئوپتىكىلىق ھەرپ-بەلگىلەرنى تونۇش دېگەنلىك بولىدۇ. ئاددىيلاشتۇرۇپ ئېيتقاندا كىتاپ، قەغەزلەردىكى يېزىقنى رەسىم ھالەتتە كومپىيۇتېرغا ئەكىرىپ ئۇنى  OCR سىستېمىسىدا تېكىستكە ئايلاندۇرغىلى بولىدۇ. ئېنگىلىزچە، خەنزۇچە ... قاتارلىق تىللارنىڭ بۇ تېخنىكىسى پىشىپ يىتىلگەن بولۇپ، يانفوندا خالىغان يەرنى رەسىمگە تارتىپ، ئۇنىڭدىكى خەتنى تېكىستە ئايلاندۇرۇشقا بولىدۇ.
ocr1.gif

ئەمدى گەپنى OCRنىڭ قەدەم-باسقۇچلىرى ۋە ھالقىلىق تېخنىكىلاردىن باشلايلى.
بىر پارچە رەسىمدىكى يېزىقنى تەھرىرلىگىلى بولىدىغان يېزىققا ئايلاندۇرۇشنىڭ ئەقەللىي قەدەم باسقۇچلىرى تۆۋەندىكىدەك بولىدۇ:
1. رەسىمنى ئەڭ مۇۋاپىق يەككە رەڭ ھالىتىگە ئۆزگەرتىش

2. بەت يۈزىنى ئانالىز قىلىش

1) قىڭغىر سايىلەنگەن بولسا تۈزلەش؛
2) بەت قىرىدىكى ئارتۇق قىسىمنى قالدۇرۇش؛
3) يېزىق، رەسىم (جەدۋەل) قىسمىنى ئايرىش؛
4) داغ نۇقتىلارنى يوقىتىش؛
3. يېزىق تونۇش

1) يېزىق قىسمىنى قۇرلارغا ئاجرىتىش؛
2) قۇرلارنى بۆلەكلەرگە ئاجرىتىش؛
3) بۆلەكلەرنى ھەرپكە پارچىلاش؛
4) ھەرپلەرنى بىرىكتۈرۈپ (ۋە ئىملا تەكشۈرۈپ) سۆزگە ئايلاندۇرۇش؛
5) بەتنى ئەسلى ھالىتى بويىچە (جەدۋەل، رەسىملەرنى جايىغا قويۇپ Word، Txt دېگەندەك شەكىلدە) ھۆججەتكە چىقىرىش.
قانداق، يېزىق تونۇتۇش سىز ئويلىغاندەك ئاددىيمىكەن؟
بۇ تېخنىكىنىڭ قەدەم-باسقۇچلىرى كۆپ بولغاننىڭ ئۈستىگە ھەر بىر باسقۇچتىكى توسالغۇ بىر-بىرىدىن قېلىشمىغۇدەك دەرىجىدە قىيىنچىلىقنى «باغاشلاپ» تۇرغاچقا ھازىرغىچە ھەل بولماي كېلىۋاتىدۇ. بۇلارنىڭ ئىچىدە ئەڭ قىيىن ھەم ئەڭ ھالقىلىقى ھەرپكە پارچىلاش جەريانىدۇر. ناۋادا ئاشۇ ھەل بولمىسا ئۇنىڭ ئالدى-كەينىدىكى باسقۇچلار قانچىلىك تەجرىبە ۋە تېخنىكا تەلەپ قىلىش ئاساسىدا روياپقا چىقسۇن، نەتىجە يەنىلا نۆلگە تەڭ. ئۇنىڭ ئۈستىگە ئۇيغۇرچە يېزىقنى ھەرپكە پارچىلاش جەريانىدىن باشقىسىغا ماتېرىيال، تەجرىبە خاتىرىلىرى ھەر ھالدا توردا تېپىلىدۇ، باشنى تاشتەك قاتۇرۇۋاتقان ھەرپ پارچىلاشقا ئامال تاپماي OCR پۈتۈشى مۇمكىن ئەمەس.
خوش، بىر پارچە رەسىمنى ئاچقاندىن كېيىن ئۇ ئۇيغۇرچە يېزىقتىكى مەزمۇنلار بولغان رەسىممۇ ياكى بىرەر مەنزىرە، ئادەم، نەقىشنىڭ رەسىمىمۇ، دېگەنگە ھۆكۈم قىلىپ ئاندىن ئۇنى تونۇتىدىغان جەرياننى ئەمەلگە ئاشۇرۇشمۇ تەس ئەمەس (ئەمما مۇھىم ئەمەس). يەنە تېمىنىڭ 1-، 2- باسقۇچلىرىدىكى بەزى تارماق تېخنىكىلارنىمۇ قويۇپ، تۆۋەندىكى ئاساستا تەجرىبە قىلىپ باقايلى (ناۋادا قىزىققۇچىلار بولسا باشقىسىنىمۇ سىناپ باقارمىز):
1. رەسىمنى يەككە رەڭ ھالىتىگە كەلتۈرۈش؛
2. قىڭغىر بەتنى تۈزلەش ۋە يېزىق، سۈرەت (جەدۋەل) قىسمىنى ئايرىش؛
3. يېزىق قىسمىنى قۇرلارغا ئاجرىتىش؛
4. قۇرلارنى بۆلەكلەرگە ئاجرىتىش؛
5. بۆلەكلەرنى ھەرپكە پارچىلاش.
يۇقىرىقىلار ئۇيغۇرچە مەزمۇن بولغان بىر بەت رەسىمنى ئاساس قىلىپ تەجرىبە قىلىنىدۇ. تېمىنىڭ قىزىق يېرىگە ئەمدى كەلدۇق (بەزىلىرىمىز ئۈچۈن تەييار كودنىڭ ئۇچراپ قېلىشى بەلەن ئىش بولسا، ماڭا مەسىلىنى ئەمەلىي تەھلىل قىلىش ھەقىقىي مەنىلىك، قىزىق ئىش).
1. رەسىمنى يەككە رەڭ (黑白) ھالىتىگە كەلتۈرۈش

بۇنداق قىلىشتىكى مەقسەتنى «ئېقى قەغەز، قارىسى سىياھ (خەت)»كە يىغىنچاقلاشقا بولىدۇ. يەنى، بىز پەقەت قارا رەڭنى ئانالىز قىلىپ يېزىق تونۇيمىز (كىتاب كۆرگەندىمۇ ھېچقاچان كىتابنىڭ ئاق قىسمىنى ئوقۇمايمىز ئەمەسمۇ).
ئەسلى رەسىم ۋە يەككە رەڭ ھالىتىگە كەلتۈرۈلگىنى:
  -->  

بۇ باسقۇچتا رەسىمنى ئانالىز قىلىپ ھەر بىر نۇقتىنىڭ رەڭ قىممىتى 255 (ئاق) ياكى 0 (قارا) بولغان ھالەتكە كەلتۈرىمىز.
كومپيۇتېردا رەسىمنىڭ بىر نۇقتىسىدىكى رەڭ قىزىل (Red)، يېشىل (Green)، كۆك (Blue) رەڭلەرنىڭ 1-255كېچە بولغان نىسبىتى بويىچە ئىپادىلىنىدۇ. يەنى:
Red=RGB(255,0,0)     Green=RGB(0,255,0)      Blue=RGB(0,0,255)
Cyan=RGB(255,255,0)  Magenta=RGB(255,0,255)  Gray=RGB(127,127,127)
Black=RGB(0,0,0)      White=RGB(255,255,255)

بۇنى تۆۋەندىكىدەك ئالگورىزم (ھېسابلاش ئۇسۇلى 算法Algorithm) ئارقىلىق ئەمەلگە ئاشۇرىمىز (تەقلىدىي كود 伪代码):
  1. 'VB.NET

  2. Dim myColor As Color
  3. Dim gray As Integer
  4. For x = 0 To Picture.Width - 1
  5.     For y = 0 To Picture.Height - 1
  6.         myColor = Picture.GetPixel(x, y)
  7.         gray = myColor.R * 0.3 + myColor.G * 0.59 + myColor.B * 0.11
  8.         If gray > 127 Then gray = 255 Else gray = 0
  9.         Picture.SetPixel(x, y, Color.FromArgb(gray, gray, gray))
  10.     Next y
  11. Next x
مەزمۇننى كۆچۈرۈۋېلىش
  1. //C#

  2. Color myColor;
  3. int gray;
  4. for (int x = 0; x <= Picture.Width - 1; x++)
  5. {
  6.     for (int y = 0; y <= Picture.Height - 1; y++)
  7.     {
  8.         myColor = Picture.GetPixel(x, y);
  9.         gray = (int)(myColor.R * 0.3 + myColor.G * 0.59 + myColor.B * 0.11);
  10.         if (gray > 127)
  11.             gray = 255;
  12.         else
  13.             gray = 0;
  14.         Picture.SetPixel(x, y, Color.FromArgb(gray, gray, gray));
  15.     }
  16. }
مەزمۇننى كۆچۈرۈۋېلىش

يۇقىرىقى رەسىمدە چەك قىممەت(阀值) 160 قىلىپ ئۆزگەرتىلدى، كودقا بولسا كۆڭۈلدىكى قىممەت 127 ئىشلىتىلگەن (يەنى، مەلۇم نۇقتىنىڭ رەڭ قىممىتى مۇشۇ قىممەتتىن چوڭ بولسا ئاق، كىچىك بولسا قارا رەڭگە ئۆزگەرتىمىز). بۇ -ئەمەلىي رەسىمگە ئاساسەن يەككە رەڭگە ئۆزگەرتىشتىكى ئەڭ مۇۋاپىق چەك قىممەتنى تېپىش. ئەمما ماسلىشىشچان چەك قىممىتىنى تېپىش ئەمەس. ماسلىشىشچان چەك قىممەتتە بىر پارچە رەسىمدىكى ئوخشىمىغان قىسىملار ئوخشىمىغان چەك قىممەتتە يەككە رەڭ ھالىتىگە كەلتۈرۈلىدۇ (بۇنداق بولمىغاندا نۇر چۈشۈش تەكشى بولمىغان بەتلەرنىڭ مەلۇم قىسمىدىكى يېزىق تونۇلماي قالىدۇ).
Paper1.jpg Paper2.jpg Paper3.jpg

بۇنى ئويلىشىش تېمىنىڭ مەركىزىي نىشانىغا ئالاھىدە مۇناسىۋىتى بولمىغاچقا كېيىنگە قالدۇرۇلدى. يۇقىرىقى رەسىمنىڭ چەك قىممىتىنى 160 قىلىپ بېكىتىپ تۇرايلى.
ئۆزىمىز بىلىدىغان پىروگرامما تىللىرىنىڭ بىرىدە يۇقارىقىنى ئەمەلگە ئاشۇرۇپ باقامدۇق؟

پىروگىراممىغا قىزىقىدىغانلار ئاستىدىكى چىپار كود(ئىككىلىك كود)نى سايىلەپ ياكى «شەرەر»، «xarar_09» دەپ ئىزدىتىپ شەرەر سالونىنى قىتىۋالساڭلار بولىدۇ.



مەنبە: شەرەر تورى

باھالاش

قاتناشقانلار سانى 6تەجرىبە +154 ئاقچا +20 يىغىش سەۋەبى
uyghurdetal + 10 مەن قوللايمەن
kerindax + 30 ياخشى يازما
mBektur + 20 مەن قوللايمەن
qut + 20
Boy卍HEr〇 + 24 ياخشى يازما
alip + 50 + 20 مەن قوللايمەن

باھا خاتىرىسى

33ئادەم ئىنكاس يازدى

yiltizboston ۋاقتى: 2017-4-27 22:23:24
【维文识别维吾尔文OCR识别SDK藏文识别阿拉伯文识别VIN码识别】,点击链接再选择浏览器打开http://c.b0yp.com/h.g4SnWN?cv=NI7WZtDitQM&sm=ecf634,或复制这条信息¥NI7WZtDitQM¥后打开
يۇمشاق دېتال ۋاقتى: 2017-4-27 16:34:13
بۇ يازمىنى ئاخىرىدا   يۇمشاق دېتال تەھرىرلىگەن. ۋاقتى  2017-4-27 16:36  

OpenCV

Screenshot_2017-04-27-14-26-54.png Screenshot_2017-04-27-14-29-37.png Screenshot_2017-04-27-14-30-53.png
شەرەر ۋاقتى: 2017-4-27 01:22:30
بۇ ھەقتە ئويلىغانلىرىڭلار ۋە ئالاقىدار تەجرىبىللىرىڭلار بولسا تېما ئاستىغا قالدۇرساڭلار بىرلىكتە ئورتاقلىشىپ باقايلى. بەلكىم يېڭى ئىدىيە ۋە ئويلار تۇغۇلۇپ قېلىشى مۇمكىن.
p520x ۋاقتى: 2017-4-27 10:33:29
قايسى كۈنى ABBYY FineReader نىڭ يېڭىلانغان نۇسخىسىنى چۈشۈرگەن ئىدىم ،،،يېزىق تۇنۇتۇش دېگەن يېرىدە ئۇيغۇرچە دەپ تۇردۇ،،، لېكىن تېخى بىرەر پارچە  ۇيغۇرچە خەتنى تونۇتۇپ باقمىدىم ،،، قىزىقىدىغانلار www.dayanzai.me     توردىن  ئىزدەپ ئىشلىتىپ بېقىڭلار ،،،، پىروگرامما بىلگەن بولسام مەنمۇ چوقۇم ئىزدىنىپ باقاتتىم ،،،
appchi ۋاقتى: 2017-4-27 11:05:08
مەن مۇشۇنىڭغا ئوخشاش بىر ئاندىرويىد ئەپ دېتالىنى ئۇچىراتقان  ،  ئۇنىڭدا  30 دىن ئارتۇق تىلدا رەسىمدىكى خەتنى تېكىست كە ئايلاندۇرۇپ بېرىدىكەن  ،  ئەمما ئۇيغۇر تىلى يوق ئىكەن ، تىل ھۆججەتلىرىنى ئايرىم چۈشۈرۈپ ئىشلىتىدىكەنمىز .
tursunxayar ۋاقتى: 2017-4-27 11:39:19
ئاخىرى چىقسا ياخشى بولاتتى ئاۋازلىق كىرگۈزگۈچتەك
Boy卍HEr〇 ۋاقتى: 2017-4-27 12:39:30
ھەجەپ قىززىقتۇردىڭىز پىروگىراممىرلىققا . . .  
elbilge ۋاقتى: 2017-4-27 13:32:31
شۇنداقمۇ بازارغا چىقمىدى بۇ نەرسە
يۇمشاق دېتال ۋاقتى: 2017-4-27 16:05:56
بۇ يازمىنى ئاخىرىدا   يۇمشاق دېتال تەھرىرلىگەن. ۋاقتى  2017-4-27 16:22  

مەنمۇ بۇرۇن بۇ توغۇرلۇق ئازراق ئىزدىنىپ باققان،
دەسلەپتە نەچچە كۈن ھەپىلىشىپ 0-9 غىچە بولغان رەقەملەرنى تونۇتتۇم،
كىيىن ئاددىي يەككە ھەرىپلەرنى تونۇتتۇم،
ئاندىن باش ئوتتۇرا، ئاياق، يالغۇز كەلگەن ھەرىپلەرنى ئەسلىدىكى تەسۋىر ئۈستىگە جىپىسلاپ قويۇپ تۇرۇپ ئوخشاشلىق نىسبىتى بويىچە بىرمۇبىر ھەرىپلەرنى تىپىپ چىقىشنى ئويلىغانتىم،

دەرۋەقە ھەر ھالدا ئۆلچەملىك يىزىلغان بەزى سۆزلەرنى تىپىپ چىقالىدىم،
لىكىن كىيىن ئويلاپ قالدىم، بۇلارنى بۇنداق ئاسانلا سىلىشتۇرۇش ئارقىلىق پەرىق قىلغىلى بولمايدىكەن،

يىزىق دىگەن قولدا يىزىلغان بولىشىمۇ، ھەر قانداق خەت نۇسقىسىدا يزىلغان بولىشىمۇ مۇمكىن،

مەنچە مەلۇم قانۇنىيەت بويىچە ماتىماتىكىلىق فورمىلا قاتارلىقلار بىلەن بىر تەرەپ قىلمىسا بولمايدىكەن،

كىيىن بۇ ئىشلارنى توختىتىپ قويغانچە،

لىكىن يىقىندا ئويلىنىپ قالدىم، بىز تەسۋىر بىر تەرەپ قىلىشنى OpenCV بىلەن بىرلەشتۈرسەك بەلكىم بەزى ئىشلار ئاسانغا توختىشى مۇمكىن


QQ截图20170427161928.png

پەقەت نەچچە كۈنلا ئىزدىنىپ باققان بوپتىمەن
كىيىن باشقا ئىشلار...
شەرەر ۋاقتى: 2017-4-27 17:53:48
يۇمشاق دېتال يوللىغان ۋاقتى  2017-4-27 14:05
مەنمۇ بۇرۇن بۇ توغۇرلۇق ئازراق ئىزدىنىپ باققان،
دەسلە ...

شۇنداق، مەيلى ھەرپكە پارچىلاش بولسۇن ياكى ھەرپنى تونۇش بولسۇن بۇلارنى بىر خىل ئۇسۇل بىلەن چىقىرىمەن دېيىش تەس. شۇنىڭ ئۈچۈن ئوخشاش بولمىغان ماتىماتىكىلىق، فىزىكىلىق ۋە باشقا خىل ئۇسۇللارنى قوللىنىش كېرەك. بىر خىل ئۇسۇل بىر قانچە ھەپنى تونىيالىسا شۇنىڭ ئۆزىمۇ نەتىجە. مۇشۇندا پارچە پارچە ئۇسۇللارنى بىرىكتۈرۈپ ئاخىرىدا بىر پۈتۈن نەتىجىگە ئېرىشىشىمىز مۇمكىن. چەتئەللىكلەرنىڭ قىلىپ باققان بىر قانچە ئۇسۇللىرىمۇ بار ئىكەن. بىر قانچە خەنچە ئىلمىي ماقالىلەردە OpenCV توغرىسىدىكى گەپلەرمۇ باركەن. قېنى مۇشۇلارنى قىلىپ پىكىر قىلىپ باقايلى. بەلكىم تۇيۇقسىز بىرە ئەقىلگە ئېرىشىپ قالامدۇق تېخى.
sadda(boy)006 ۋاقتى: 2017-4-27 19:13:13
p520x يوللىغان ۋاقتى  2017-4-27 10:33
قايسى كۈنى ABBYY FineReader نىڭ يېڭىلانغان نۇسخىسىنى چۈشۈرگەن ...

بىراق ئ‍ۇيغۇرچىنىڭ OCR ھۆججىتى چۈشمەيدىكەن ، باشقا تىللارنىڭكى چۈشىۋاتىدۇ
يۇمشاق دېتال ۋاقتى: 2017-4-27 21:55:57
بۇ يازمىنى ئاخىرىدا   يۇمشاق دېتال تەھرىرلىگەن. ۋاقتى  2017-4-27 22:07  

OpenCV نىڭ ئىقتىدارى ھەقىقەتەن كۈچلۈك،
تولۇق پايدىلىنالىساق ئالا بۇلىماچ، ھەر خىل رەڭلىك، ھەر خىل ئۆلچەمدە يىزىلغان يىزىقلارنىمۇ رەڭ بىلەن مۇناسىۋەتىسز رەسىمگە ئايلاندۇرۇپ ئاخىرىدا پەرىق قىلىۋەتكىلى بولىدۇ،

دىمەك بۇنىڭ بىلەن بىزنىڭ رەسىمگە قارىتا پىششىقلاپ ئىشلەيدىغان نۇرغۇن قىيىنچىلىقلار ھەل بولۇپ كىتىشى مۇمكىن،
ھەم OpenCV مۇ سۇپا ئاتلىغان ئوچۇق مەنبەلىك ھەقسىز،

لىكىن بىز دۇچ كىلىدىغان چوڭ مەسىلە:
سىز دىگەندەك بەتنى قۇرلارغا، قۇرلارنى سۆزلەرگە، سۆزلەرنى ھەرىپلەرگە...

ئاخىرىدا مەلۇم قانۇنىيەت بويىچە شۇلارنى پەرىق قىلىش،
بىز ئامال قىلىپ ھەر قايسى ھەرىپلەرنىڭ قانۇنىيىتى، شەكلىنى رەقەملەشتۈرۈپ ئۇنى پروگرامما ئارقىلىق تەسۋىرلەپ چىقىش، يەنى پروگراممىدا شۇ قانۇنىيەتنى تەسۋىرلەش،

بىز قولدا يىزىلغان بىر خەتنى كۆرسەك دەقىقە ئىچىدە شۇ خەتنى پەرىق قىلىپ بولالايمىز،
دىمەك بىزنىڭ شۇ خەتنى تونۇشىمىزغا يىتەكچىلىك قىلىۋاتقان، نەرسە بار،
يەنى بىزنىڭ خاتېرىلىرىمىزنىڭ چوڭقۇر قاتلىرىدا شۇ ھەرىپلەرنىڭ تەسۋىرى ساقلانغان،
كاللىمىزدا شۇ ھەرىپلەرنىڭ تەسۋىرى قانۇنىيىتى ئورناپ كەتكەن، بىز كاللىمىزدىكى شۇ قانۇنىيەت بويىچە دەرھال شۇ يىزىقنى پەرىق قىلالايمىز....
ئىنتايىن نازۇك جەريان...

مىنىڭ ئويلىغىنىمدا:
ئەڭ ئاۋال OpenCV دىن ئۆتكۈزۈلۈپ مۇناسىۋەتسىز تەركىبلەر سۈزىۋىتىلگەن، پارچىلىنىپ بولغان ھەرىپلەرنى يەنىمۇ OpenCV ئارقىلىق پىششىقلاپ ئىشلەپ شۇ ھەرىپنىڭ ئىسكىلىتىنى ئىپادىلەپ چىقساق
ئاندىن SVG غا ئوخشاش مەلۇم قانۇنىيەت، فورمۇلالار ئارقىلىق تەسۋىرلەنگەن قىلىپلارغا شۇ ھەرىپنىڭ ئىسكىلىتىنى كىرگۈزسەك...

ئىشقىلىپ مىنىڭ ئويلىيالىغىنىم مۇشىنچىلىككەن،
قالغىنى مەسىلىنى ھەل قىلىش ئۇسۇلى...

ئامال قىلىپ بىز ھەرىپلەرنى ئىسكىلىتقا ئايلاندۇرۇپ SVG غا ئوخشاش ئۆزىمىز بەلگىلىگەن فورمۇلا، قانۇنىيەت بويىچە ساقلاپ ئاندىن كىيىن شۇ قانۇنىيەت بويىچە باشقا ھەرىپلەرنى پەرىق قىلساق...
ئەگەر خالايدىغانلار بولسا بىر مۇزاكىرلىشىپ مۇلاھىزە قىلىپ قول تىقىپ باقىمىز.
yiltizboston ۋاقتى: 2017-4-27 22:24:56
60000يۈەن دەيدۇ 98%تونۇيدىغانلىقىغا كاپالەت قىلدىكەن لىكىن بۇنى بىرەر شىركەت ئالمىسا شەخىس كۆتۈرەپ بولالمىغدەك
elbilge ۋاقتى: 2017-4-28 12:52:54
بۇ بىزنىڭ كومپىيۇتېر ساھەيىمىزدىكى بىر بوشلۇق بوپ قالغان ئوخشايدۇ
tormahiri ۋاقتى: 2017-4-28 13:36:03
كومپيۇتېر ساھەسىدە تېخى بىز قىلىپ بولالمىغان نورغۇن نەرسىلەر بار،ocr غا سۈنئى ئەقىل نى قوللانسا تېخىمۇ ياخشى ئۈنۈمگە يەتكىلى بولىدۇ
Gvllinayli ۋاقتى: 2017-4-28 13:49:29
بۇ يازمىدىكى بەزى ئېنىقلىمىنى چۈشۈنۈش ئۈچۈن بېرىلگەن ھەرپلەرنى بىر-بىرلەپ چۈشۈرۈپ قويماي ئوقۇغايسىز.
[ئېچىلىۋاتقان قىزىل ئەتتىرگۈل ئىپادىسى]
يۇمشاق دېتالنىڭ دېگىنىدەك رەسىمگە ھەرپلەرنى جىپسىلاشتۇرۇپ ئوخشاشلىق نىسبىتى بويىچە تېپىش ئەڭ تېز ئەمەلگە ئاشىدىغاندەك قىلىدۇ. رەسىمدىن تاللىغان ئورۇندىكى سۆزنىڭ ئۈستىگە ئامباردىكى ھەرپلەرنىڭ ھەممە شەكىللىرىنى بىر-بىرلەپ قويماي ئاۋال رەسىمدىكى ئوڭ تەرەپ بىرىنچى ھەرپىنىڭ دەسلەپكى تەسۋېرى (كوئوردېناتلىق قىممىتى) نى بېكىتىپ چىقىپ،① ئامباردا ساقلانغان ھەرپلەرنىڭ ھەممە شەكىللىرىنىڭ كوئوردېناتلىق قىممىتىنى سېلىشتۇرساق ئەڭ يېقىن كېلىدىغان بىرسى چىقىدۇ، شۇ ئوخشاشلىقتىكى ھەرپنى شۇ دېيىش ئاندىن مۇشۇ بويىچە ئوڭ تەرەپ ئىككىنچى ھەرپتىن باشلاپ يەنە داۋاملاشتۇرۇش. مەن بۇ توغرىسىدا ئالىم ئەھەت مۇئەللىمنىڭ بىلوگىدا ئىنكاس يازغان. ھازىر ئويلاپ باقسام مەن پەقەت ھەرپلەرنى قانداق قائىدە بويىچە ئۇلاشنىلا ئوتتۇرغا قويۇپتىمەن. بۇ OCR دا يېزىق ئۇلاش باش قېيىنچىلىقى يوق ھەم بولمايدۇ. ھەرپلەرنىڭ مەيلى قايسى شەكلىنى پەرق ئېتەلىسە ئۇ بەرىبىر بىر ھەرپكىلا ۋەكىللىك قىلىدۇ، رەسىمدە بېرىلگەننى تونۇش بىلەن ئۇنى بىزگە قانداق چىقىرىپ بېرىش ئىككىسى ئىككى خىل بولسا ئىشلار ئاسانلىشىدۇ. مەسىلەن بىر رەسىمدە [ باشلىنىش ] سۆزى بار.
بۇنى ئوڭ تەرەپ بىرىنچى ھەرپنى تونىغاندا ئامباردىكى بەلگە (ھەرپمۇ بەلگە) [بـ] دەپ تونۇش ئاندىن بۇنى «ب» ھەرپىنىڭ باش قىسىمى دەپ ئايرىم كۆرسىتىپ يۈرمەي «ب» دەپلا كۆرسەتسە ئىش تامام.
بىز يۇقارقى سۆزنى نېمىشقا «ب» ھەرپى دەپ تونۇيالىدۇق؟
تۆۋەندە ئىنسانلار دەقىدە تەھلىل قىلغان ئانالىز جەريانىنى تەپسىلىرەك ئىپادىلەپ باقتىم، ئوقۇش جەريانىدا زېرىكىپ ئۇسساپ قېلىشىڭىز مۇمكىن، لېكىن بۇنىڭ ياردىمى تېگەر دەپ ئويلىدىم.
1. بۇ [بـ] شەكىلنىڭ دەسلەپكى شەكلى كاللىمىزدىكى ئامباردا ساقلانغا تومۇر(ھەرپ سىزىقى)دىن تۆپىسىگە دىيىش (تىك سىزىق) چىقىرىلغان ھەرپ شەكىللىدىن «نـ، ئـ، تـ، پـ، بـ، يـ» لارغا ئوخشاۋاتىدۇ. پەرق ئېتىشچانلىقىنى سەل تۆۋەنلەتسەك ماس كەلمىگەن شەكىللەر[ سـ، شـ، چـ، جـ، خ، ڭـ، كـ، گـ، ۋ، ـېـ، ـىـ، ر، ز، ژ، ھ، غ، مـ، ۇ، ۈ، ۆ، و، د، ژ، ا، فـ، لـ] نىڭ ئىچىدىكى [سـ، شـ، ـېـ، ـىـ، لـ] لارمۇ سەل ئوخشاپ تۇرىدۇ، شەكىل [بـ] نى يەنىمۇ تەكشۈرسەك تەسۋىر [سـ] دېكى بىرىنچى دىيىش [ىـــىىـ] قا ئوخشاۋاتىدۇ، لېكىن تېگىدە چېكىت يوق شۇڭا [سـ ھەم شـ] لار چوقۇم ئەمەس( ئەگەر يەنىمۇ ماس كەلگەنلىرى چىقمىسا مۇشۇ شۇ)1*.
~ شەكىل [لـ] نىڭمۇ تومۇرنىڭ تۆپىسىدە دىيىش بار لېكىن چېكت يوق (رەسىمدىكى شەكىلنىڭ دىيىشى سۈزۈشتە قىسقىراپ كەتكەن بولسا ھەم چېكتمۇ ئۆچۈپ كەتكەن بولسا مۇشۇ شۇ).
~شەكىل [ـېـ ۋە ـىـ] لارنىڭ تېگىدە تاق چېكت يوقكەن ھەم ئالدىدا سىزىقچە باركەن شۇڭا بۇ [ـىـ،] شەكىل رەسىمدىكى شەكىل [بـ] غا قەتئي ئوخشىمايدۇ، بۇلارنىڭ يەنە بىرى [ـېـ] نىڭ ئالدىدا سىزىقچە باركەن لېكىن تېگىدە چېكت باركەن شۇڭا بۇممۇ ماس كەلگەن شەكىل ئەمەس (ئالدىدىكى سىزىقنى ھېسابقا ئالمىغاندا ھەم رەسىمدىكى شەكىلنىڭ بىر چېكىتى تاساددىپى كۆرۈنمىدى دېيىلسە بۇ شەكىل شۇ بولۇش ئېھتىمالى بار)2*
~ باشقا شەكىلدىن [چـ، جـ، خـ] لانىڭ ئوڭ تەرەپ 30 گىرادوسلۇق بۇلۇڭ شەكلى رەسىمدىكى شەكىل [بـ] غا زورلىساق ئوخشاۋاتىدۇ لېكىن يەنىمۇ سۈزگەندە ھەتتا شەكىل [جـ] مۇ بەك يېقىن كېلەلمەيۋاتىدۇ بۇ بولىشى ناتايىن (ئەگەر رەسىمدىكى [بـ] شەكلىنىڭ تۆپىسى بىرتەرەپ قىلىشتا بۇزۇلغان بولسا بۇ شەكىل شۇ بولىشى ئېھتىمال).
~ باشقا شەكىل [ڭـ، كـ، گـ ] لارمۇ ئوخشىمايۋاتىدۇ رەسىمدىكى شەكىل [بـ] نى سۈزۈشتە بۇزۇلغان دېسەكمۇ شەكىل [ڭـ، كـ، گـ] لارنىڭ ئالاھىدىلىكىدىن بىرەر يانتۇ سىزىقچە (گ ھەرپىنىڭ تۆپىدىكى سىزىق)مۇ يوق ئۇنىڭ ئۈستىگە بۇزۇلدى دېسەكمۇ ئۆزىدىن بىرنەچچە ھەسسە يېرى پاك-پاكىز بۇزۇلمايدۇ شۇڭا بۇ شەكىل رەسىمدىكى شەكىل مۇتلەق ئەمەس شۇڭا، نەزەردىن ساقىت قىلىمىز.
~ قالغانلىرىدىن [ۋ، و، ۇ، ۆ، ۈ] لەرنىڭ چەمبەر ھالقىسىدىكى ئوڭ تەرەپ 80 گىرادوسلۇق بۆلىكى رەسىمدىكى شەكىل [بـ] گە زەرىچە ئوخشاۋاتىدۇ (يۇقارقى 1*، 2* ۋە باشقىسى ئوخشىمىسا مۇشۇ بولىشى مۇمكىن)3*.


【يېقىنراقى】
2. بۇ [بـ] شەكىلنىڭ تۇرقى ئويلىغىنىمىزدەك ھەرپ شەكىللىرى «نـ، ئـ، تـ» گە ئوخشاش تۆپىدە نە بىرەر تال چېكت ئېتى بار «ئ» (ھەمزە) ياكى قوش چېكتلەر يوق شۇڭا، بۇممۇ ئەمەس. (يۇقارقى 1*، 2*، 3* لارنى تاشلىۋەتسەك مۇشۇ شۇ).4*

3. بۇ [بـ] شەكىلنىڭ تېگىدە چېكت بار، ئامباردىكى شەكىل [پـ] دىمۇ چېكت بار شۇڭا بۇ [پـ] شەكىل رەسىمدىكى شەكىل شۇ بولىشى مۇمكىن. (بۇنىڭدىنمۇ يېقىنراقى بولمىسىلا).

4. بۇ [بـ] شەكىلنىڭ تۇرقى ئويلىغىنىمىزدەك ھەرپ شەكىللىرىدىن [بـ] غا بەك يېقىن كەلدى شۇڭا يۇقارقى 1*.2*.3*.4* ۋە باشقا شەرتلەرنى نەزەردىن ساقىت قىلىمىز. (پەقەت مۇشۇ شەكىلنى ياخشى ئەستە تۇتقان بولساقلا)

يۇقارقىلار بىز ئىنسانلارنىڭ ھەرپ «بـ» نى يازمىدىن دەقىدە پەرق ئەتكەندىكى ئانالىزلىرى، دېمەك مۇشۇلارنى پىروگراممىدا ئىپادىلەپ، تېكىست-جۈملە-سۆز-ھەرپ لەرنى بىردىن-بىردىن مۇشۇنداق ئانالىز قىلالىساق ئىش تامام.
مەسىلە:
32 ھەرپنىڭ بارلىق شەكىللىرى ۋە باشقا ئېھتىماللىقنى ئامبارغا كوئوردېناتلىق ساقلاپ بۇنى ھەرخىل نىسبەتتە چوڭ-كىچىكلېتىش بۇيرۇقىنى قوشۇش. ئىشنى رەسىمدىكى بىرتەرەپ قىلىش دائىرسىدىكى سۆزنىڭ ئوڭ تەرەپ 0 ئورنىدىن باشلاپ تەھلىل قىلىدۇرۇش.
جەريان:
بۇ 0 نوقتىدىن تارتىپ تاللانغان سۆزنىڭ ئاساسى چوڭلۇقىنى سۈكۈتتىكى بىرتەرەپ قىلىش چوڭلىقىغا تەڭلەشتۈرۈش.
ئاندىن تاللانغان سۆزنىڭ ھەرپ تومۇر(بارلىق ھەرپلەرنىڭ تۈز سىزىقى)نىڭ تۆپى ۋە تېگىدىكى ھەمزە، چېكىت، ھالقا(مەسلەن و،ۇ،ۋ دېگەندەكلەرنىڭ ھالقىسى) سىزىقچىلارنى نىگىز قىلىمىز.
بۇ نىگىزلەرنى سۆز تومۇرىدىن ئىگىزلىكى، كەڭلى بويىچە كوئوردېناتقا ئايلاندۇرىمىز.
ئامبارغا بارلىق ھەرپ شەكىللىرىنىڭ سۆز تومۇردىن پەرىقلىندىغان بۆلىكىنى ساقلايمىز. مەسلەن بۇ بۆلەكلەر:
[بـ] ھەرپىنىڭ سۆز تومۇرىدىن پەرقلىنىدىغان بۆلىكى ئۇنىڭ تىك چىققان دىيىشى ۋە تېگىدىكى چىكىت. [ڭ] ھەرپىنىڭ سۆز تومۇرىدىن پەرقلىندىغان بۆلىكى ئۈستىدىكى تىك سىزىق ۋە بىر يۈرۈش ھەمزە+چىكىتلەر.
ئاۋال بۇ بۆلەكلەرنى سۆز تومۇرىدىن قانچىلىك نىسبەتتە ئېگىز، قانچىلىك نىسبەتتە پەستە دېگەندەك مۇقىم بىر ئارلىقنى ساقلايمىز.
ئاندىن بۇ تومۇردىن پەرقلىندىغان بىر يۈرۈش بۆلەكلەر ئامبىرىنى ئامبارغا قوشىمىز. بۇ بۆلەكلەر:
[چـ] دىكى ئوڭدىن باشلىنىپ تەدېرىجى سولغا ئېگىلگە قاشسىمان بۆلەك ۋە، ئاستىدىكى ئۈچ چېكت.
رەسىمدىن بۇ [چـ] غا ھۆكۈم قىلىدىغان مۇھىم ھالقا سۆز تومۇرى ۋە بۆلەك. سۆز تومۇرى بولسا ھەممە ھەرپلەرگە ئاساسەن ئورتاق بولغان بىر ئورتاقلىق. شۇڭا مۇشۇ ئورتاقلىقنى تۇراقلىق مىقدار جۈملىدىن كوئوردېناتنىڭ 0 نوقتىسى دەپ مۇشۇ نوقتىنىڭ تۆپى، تېگى، تولۇقلىما ئوڭى ۋە تولۇقلىما سولى نى پەرق ئەتسەكلا كۇپايە.
تولۇقلىما سولى: بەزى ھەرپلەر سۆز تومۇرىدىن ئۈزۈك ھالدا ئويمان داۋاملىشىدۇ بىز مۇشۇ ئويمان ئورۇننى تومۇر بويىچە تولدۇرۇپ تۇرۇپ تەھلىل قىلىمىز. مەسىلەن: [باشلاندى] سۆزىدىكى «ى» ھەرپىدە بەك كۆرنەرلىك. شۇڭا بۇ «ى» ھەرپىنىڭ بۆلىكى سۆز تومۇرىدىن ئۇزۇن. ئامال قىلىپ سۆز تومۇرىنى ئۇزارتىپ بۆلىكى بىلەن تەڭ قىلىمىز. مەسلەن «ى» ھەرپىدىكى ئوڭ تەرەپتىكى لاتىنچە c غا ئوخشاپراپ كەتكەن ئورۇننىڭ ئاستى تەرىپىنى سول تەرەپكە تەخمىنى ئۇزارتىپ «ى» ھەرپىنىڭ بۆلەك ئۇزۇنلۇقى بىلەن تەڭلەشتۈرىمىز تەڭلەشكەندىكى كۆرۈنۈش «غـ» ھەرپىنىڭ چېكىتى يوق ھەم سىزىقچىنىڭ تېگىدىن بۆلەك بىلەن تومۇر تۇتاشقان ئورۇنغىچە بىر يېرىم چەمبەر شەكىلى ھاسىل بولىدۇ. بۇ تولۇقلىما سول تومۇر ياكى تولۇقلىما سولى دەپ ئاتالدى، مۇشۇ تومۇر+تولۇقلىما سولىنىڭ تېگىدىكى يېرىم چەمبەرسىمان بۆلەك ھەم تۆپىدىكى تومۇرغا تۇتاشقان لاتىنچە c سىمان بۆلەكنى پەرقلىق ئورۇن، تومۇر+تولۇقلىما سول تەرەپنى پايدىلنىش چىگرىسى قىلساق بۇ «ى» ھەرپىنى باشقا ھەرپلەردىن پەرقلەندۈرەلەيمىز.
تولۇقلىما ئوڭى: بۇممۇ بەزى پەرپلەرنىڭ سۆز تومۇرىنىڭ سۆز بۆلىكىدىن قىسقا بولىشىنى تولۇقلاشتا پايدىلىندىغان ئورۇن. مەسلەن: [چـ، جـ] قاتارلىقلار؛ بۇلارنى پەرق ئەتكەندە سۆز تومۇرىنى 0 نوقتا قىلىپ تۆپى-تېگىگە بۆلسەك تەگ قىسىمىدا تومۇر بىلەن چېكتنىڭ ئوتتۇرسىدا ئوڭغا داۋاملاشماي قالغان تومۇر بار. بىز ئاشۇ كەم ئورۇننى سۆز تومۇرى بىلەن تەڭ قىلىپ تولۇقلايمىز. مۇشۇ ھالەتنى تولۇقلىما ئوڭ تومۇر ياكى تولۇقلىما ئوڭى دەپ ئاتىدىم.


مۇشۇنىڭدىكىدەك ھەممە ھەرپلەرنى تونۇتۇشتا ئۈچ نەرسىدىن پايدلانساق بولىدۇ:
【1】سۆز تومۇرى.
【2】تولۇقلىما ئوڭ-سولى
【3】سۆز بۆلىكى
بۇنىڭدا سۆز تومۇرى پايدىلنىش سىزىقى قىلىنىدۇ، سۆز بۆلىكى بولسا پايدىلنىش سىزىقىنى چىگرا قىلىپ، ئۈستى-ئاستىغا كېڭەيگەن يادرولۇق قىسىمى قىلىنىدۇ. بۇ يادرولۇق قىسىم بىر-بىرىگە ئوخشىسا بولمايدۇ، لېكىن سۆز تومۇرى بىر تۈز سىزىققا يېقىنلاشقاندىلا ئۆزىنىڭ پايدىلنىش سىزىقى ئىكەنلىكىنى نامايەن قىلىدۇ.
مۇشۇ جەريانلارنى OCR دا پايدىلانسا بولىدۇ.









pinhan ۋاقتى: 2017-4-28 15:26:29
بۇ يازمىنى ئاخىرىدا   pinhan تەھرىرلىگەن. ۋاقتى  2017-4-28 17:35  

ئۇيغۇرچە ئو سى ئەر توغرىسىدا گەپ قىلساق ئۇزۇن ھەيران قالارلىق ھىكايىلەر چۇۋۇلۇپ چىقىدۇ
شەرەر ۋاقتى: 2017-4-28 17:48:52
بۇ يازمىنى ئاخىرىدا   شەرەر تەھرىرلىگەن. ۋاقتى  2017-4-28 15:50  

ئەڭ ئاۋۋال قىيپاش بەتنى تۈزلەپ بولۇپ، ئاندىن قۇرغا بۆلىمىز ۋە ھەر بىر قۇرنىڭ ئەڭ ئېگىز نوقتىسى ۋە ئەڭ تۆۋەن نوقتىسىنى خاتىرلىۋالىمىز.
ئەمدى بىز بۇ قۇرنى سۆزگە ۋە ماس ھەرپكە پارچىلاپ بولغاندىن كېيىن، پارچىلىۋالغان ھەرپنى ئۈستىدە ئېلىۋالغان ئىككى نوقتا بويىچە بىر كاتەك ئىچىگە ئېلىۋالغاندىن كېيىن. بۇ كاتەكنى گورزىنتال ھالەتتە تەپمۇ-تەڭ تۆت بۆلەككە بۆلىمىز(خۇددى كىچىك چاغلاردا خەت يازىدىغان بەش سىزىقلىق دەپتەرگە ئوخشاش). ھەمدە ھەر بىر بۆلەكتىكى قارا نوقتىنىڭ قۇيۇقلۇقى ۋە تارقىلىشىغا ئاساسەن شۇ ھەرپكە ھۆكۈم قىلساق بولىدۇ.
Char.png
گەرچە ئۇيغۇرچە خەت نۇسخۇسى كۆپ بولسىمۇ لىكىن ھەممە ھەرپ ماس نىسبەتتە ئۆزگەرگەچكە قۇيۇقلۇق ياكى تارقىلىشى ئوخشاش بولىدۇ. ئەلۋەتتە بۇ ئۇسۇل قوليازمىغا ماس كەلمەسلىكى مۇمكىن.
Gvllinayli ۋاقتى: 2017-4-28 17:50:55
بۇ يازمىنى ئاخىرىدا   Gvllinayli تەھرىرلىگەن. ۋاقتى  2017-4-28 18:04  

خەت نۇسخا دېگەن نەۋاق ئۆلچەملىشىپ بولدى.
شۇ ھەممە كىشى ئۆلچەملىك شەكلىنى ئىشلەتمەي ئۆزى خالىغاننى ئىشلەتكەچكە شۇنداق تۇيۇلغان نېمە. بۇ تېخنىكىنى بىزنىڭ يېزىقىمىزغا قوللىنىشنىڭ بەك پەۋقۇلادە زۆرۈريىتى يوق، بۇ يېزىقنى كىرگۈزۈش ئاسان دەپ قارالغانلىقتىن تاھازىرغىچە ياسالمىدى ھەم بۇنىڭغا ئارتۇق مەبلەغمۇ يوق. بۇ بىر سەۋەبلەر. دېمىسىمۇ يېزىقىمىز ئېنگلىز، روس يېزىقلىرىغا ئوخشاشلا ھەرپلىك يېزىق. بۇنى خەنسۇچە ياكى باشقا ھەرپلىرى بولمىغا يېزىقلارغا ئىشلېتىشكە ماس كېلىدۇ دەپ قارىلدۇ. لېكىن يىتەرلىك ۋاقت ۋە زېھىن ياربەرسە ئىزدىنىپ بېقىشقا ئەرزىيدۇ.
oyqan1 ۋاقتى: 2017-4-28 23:26:35
مەن زۆرۈيىتى بار دەپ قارايمەن ، چۈنكى مەتبۇئاتلارغا يوللانغان قوليازما ئەسەرلەرنى بىر بىرلەپ كومپىيوتېرغا كىرگۈزۈپ ئاندىن بېسىپ چىقىرىشقا خېلى كۆپ زېھنى كۈچ كېتىدۇ . مۇشۇ تېخنىكا قوللانغان ۋاقتىدا زېھنى كۈچ ۋە ۋاقىتنى زور دەرىجىدە تىجەپ قالغىلى بولىدۇ.
يۇمشاق دېتال ۋاقتى: 2017-4-28 23:55:51
مەنچە بۇنى ئاددىيلا بۇنداق رەسىم سىلىشتۇرغاندەك سىلىشتۇرساق بولمايدۇ،
چۈنكى خەت نۇسقىلىرى ھەر خىل، قوليازمىمۇ ھەم شۇنداق،
ئۇنىڭ ئۈستىگە بىر قۇر خەت تۈپتۈز يزىلغان بولىشى ناتايىن،
بۇلارنىلا دىمەي تۇرايلى، ئىشقىلىپ بىر بىرىگە ئوخشىشىدىغان ھەرىپلەرنى بىر بىرىدىن پەرىق قىلىش ئاسان ئەمەس،
قارىماققا بۇ ئۇسۇل ئاساندەك قىلغان بىلەن لىكىن ئاخىرى چىقمىقى بەك تەس ھەم چىقمايدۇ،
چىققان تەقدىردىمۇ پەقەت قىسمەن خەت نۇسقىلىرىغىلا ئىشلەيدىغان نەرسە بولۇپ چىقىدۇ،

مەنچە بولغاندا ھەر بىر ھەرىپنىڭ ئىسكىلىتىنىڭ ۋىكتورلۇق ئۆزگىرىش قانۇنىيىتىنى بايقاپ تەسۋىرلەپ چىقىپ شۇ قانۇنىيەتكە سالساق ئاندىن پەرىق قىلىش ئىقتىدارىنى يۇقىرى كۆتۈرەلىشىمىز مۇمكىن،
ھەم بىز مەيلى قانداق خەت نۇسقىسى ئىشلىتەيلى، قانداقلا يازايلى بىزنىڭ سىلىشتۇرىدىغىنىمىز ماس كىلىش نىسبىتى ئەمەس بەلكى شۇ خەتنىڭ يىزىلغان قانۇنىيىتى
Gvllinayli ۋاقتى: 2017-4-29 08:07:23
بۇ يازمىنى ئاخىرىدا   Gvllinayli تەھرىرلىگەن. ۋاقتى  2017-4-29 08:16  
يۇمشاق دېتال يوللىغان ۋاقتى  2017-4-28 23:55
مەنچە بۇنى ئاددىيلا بۇنداق رەسىم سىلىشتۇرغاندەك سىلىش ...


ھازىر ئاساسەن ukij نىڭ خەت نۇسخىلىرى قوللىنىلىپ كەلمەكتە. شۇنىڭ ئۈچۈن بۇ خەت نۇسخىلىرى ھەرخىل بولسىمۇ خەت تومۇرى بىر تۈز سىزىقتا بولۇش پىرىنسىپغا ئەمەل قىلغان. ھازىرچە مەتبۇئات شەكلىدىكىنى تونۇيالىسا شۇممۇ بىر ئۇتۇق. باشقا قوليازما شەكلىنى تونۇتۇش تېخى خەنسۇچىنىڭ راۋۇرۇس ئەمەلگە ئاشمىدى. ئۇممۇ پەقەت تۈز خەت ۋە بىرنەچچە نۇسخىدىكىنىلا تونۇيالايدىكەن. ھۆسۈنىخەت شەكلىگە تېخى خېلى ھايلى باركەن.
شۇڭا، بىزمۇ ئالدى بىلەن ئەڭ كۆپ ئىشلىتىلۋاتقان خەت نۇسخىسىنى تونۇتۇشتىن باشلىساق بولىدۇ. خەت نۇسخىىنى ئۆلچەملىك قائىدىگە سېلىپ ياسىغانلا بولسا مەيلى قايسى شەكلى بولمىسۇن ئۇيغۇرچىنىڭ تومۇرى يىپتەك تۈز يېزىلىدۇ. بەزى قاراشلاردا ئامبارغا سۆز ۋە قوشۇمچىلارنى قوشۇپ پەرقلەندۈرۈسەك بولغۇدەك دېيىلۋاتىدۇ، لېكىن شۇنچە كۆپ سۆزلۈك ۋە قوشۇمچىلارنى ئامبارغا قوشقاندىن چەكلىك ھەرپنىلا قوشۇپ يېڭىدىن ياسالغان سۆزنىمۇ تونۇيدىغان قىلغىلى بولىدۇ.
سۆز تومۇرى ئاساسىي ھالقا. بۇنى پايدىلنىش قىلمىساق باشقا ئامال بارمۇ؟
بۇ يازمىلارنى ئوقۇۋېتىپ قۇر-قۇرلاردىكى ھەرپلەرنىڭ تومۇرلىرىنىڭ ئىلىپتەك تۈز كۆرۈنىۋاتقانلىقىنى بايقايسىز. بۇ بىردەكلىك بولماي نېمە؟ ھەرپ تومۇرىنى چېگرا قىلىپ تونۇتۇش ئاقىلانىلىك.
YUSUF5200 ۋاقتى: 2017-4-30 10:22:00
قولدا يازغان خەتنى تونىيدۇ دىگەندىمۇ، ھەممە كىشىلەرنىڭ خەت  پۇچۇركىسى ھەرخىل  تۇرسا  بۇنىڭدا يەنە مەسلە كۆرۈلمەسمۇ مەسلەن بەزى كىشلەر (ۆ)ھەرپىنى(ۈ،و،ۇ)دەك يازىدۇ يەنە تېخى ې،ي،ى…ھەرىپلەرچۇ
Gvllinayli ۋاقتى: 2017-5-1 12:45:36
YUSUF5200 يوللىغان ۋاقتى  2017-4-30 10:22
قولدا يازغان خەتنى تونىيدۇ دىگەندىمۇ، ھەممە كىشىلەرنى ...

باشقا تىللاردىمۇ قوليازما تونۇتۇش تېخى راۋۇرۇس پىشمىدى.
بىز ھازىرچە باسما نۇسخىنى تونۇتساق شۇ غەلبە.
sewdaye ۋاقتى: 2017-5-2 10:46:49
مەنچە ئۇيغۇرچىنى تونۇتۇش ئۈچۈن ھەرىپ پارچىلاش ئەمەلگە ئاشمىغاندا سۆز ۋە سۆز بىرىكمىسىگە سېلىشتۇرۇپ يېزىققا ئايلاندۇرىدىغان قىلساق قانداق بولار دەيمەن، ئالىم مۇئەللىمدە ئۇيغۇرچە سۆز ئامبىرى بار، ئالىم ئەھەت تور بىكىتىدە بىر چاغدا 150مىلىيوندىن ئارتۇق سۆز بىرىكمىسى بار دىگەندەك قىلغان. شۇ سۆزلۈك ئامبىرىنى ئىشلىتىپ، سۆز ۋە سۆز بىرىكمىسىگە سېلىشتۇرۇش ئارقىلىق يېزىققا ئايلاندۇرىدىغان قىلساق سەل ئاسانمۇ قانداق؟
ھەرىپ بويىچە بولسىغۇ تېخىمۇ ياخشى بولاتتى.  مەن ئىسىم تەرجىمە قىلىدىغان دىتالنى سېتىۋىلىش مەغلۇب بولغاندىن كىيىن ئىسىم لۇغەت ئامبىرى ياساپ، ئىسىمنى ئىسىم بويىچە تەرجىمە قىلىدىغان فونكىسىيە ياسىۋالدىم، مۇشۇمۇ خېلى ياخشى ئىشلەۋاتىدۇ، لىكىن داۋاملىق ئامبار يېڭىلاش ئاۋارىچىلىقى بار شۇ.  شۇنىڭدەك سۆزلۈك ئامبىرىغا سېلىشتۇرىدىغان قىلساق  قانداق بولار
شەرەر ۋاقتى: 2017-5-2 11:57:25
sewdaye يوللىغان ۋاقتى  2017-5-2 08:46
مەنچە ئۇيغۇرچىنى تونۇتۇش ئۈچۈن ھەرىپ پارچىلاش ئەمەلگە ...

ئەلۋەتتە بۇ ئۇسۇلمۇ بولىدۇ، لىكىن بۇنىڭدا ئامبار تولۇق بولمىغان ئەھۋال ئاستىدا تونۇش توغۇرلىقى تۆۋەن بولىدۇ. ھەم ئامبار سىغىمىمۇ يۇقىرى بولىدۇ. تونۇش سۈرئىتىمۇ ئاستا بولىدۇ. ئەگەر بىز قانۇنىيەت بويىچە ھېسابلاش ئۇسۇلى تۇرغۇزساق مەيلى سۈرئەت ياكى توغۇرلۇق دەرىجىسى بولسۇن ياخشى بولىدۇ.
ھازىر بىر قانچىمىز ھەرپ پارچىلاشنى قىلىپ، مەلۇم نەتىجىگە ئېرىشتۇق. ئەمدى ئۇنىڭ توغۇرلۇق دەرىجىسىنى ۋە سۈرئىتىنى ئاشۇرساق دەسلەپكى قەدەمدە ئەمەلىي ئىشلىتىپ باقساق بولىدۇ.
Gvllinayli ۋاقتى: 2017-5-4 01:53:24
بۇ يازمىنى ئاخىرىدا   Gvllinayli تەھرىرلىگەن. ۋاقتى  2017-5-4 01:58  
sewdaye يوللىغان ۋاقتى  2017-5-2 10:46
مەنچە ئۇيغۇرچىنى تونۇتۇش ئۈچۈن ھەرىپ پارچىلاش ئەمەلگە ...


سۆزلەرنى تونۇتۇش ئۈچۈن ئىشلېتىش ئىھتىمالى بولغانكى سۆزلەرنىڭ بارىنى ئامبارغا قوشۇش كېرەك. بىز ئەڭ كۆپ ئىشلېتىمىز دېگەن سۆزنى يىغقاندىمۇ بەش ئالتە مىڭچە سۆزلۈك چىقىدۇ. لېكىن مۇشۇ سۆزلەر لۇغەت شەكلىدىكىدەكلا قوللىنىلمايدۇ، بۇ سۆزلەرگە ھەرخىل قوشۇمچىلار ئۇلىنىدۇ بۇنىڭ بىلەن بۇ تۇراقلىق دەپ ھېسابلىغان سۆز سانىغا قوشۇمچىلار ئۇلىنىپ ئۆزىنى بىر قاتلىشى مۇمكىن.
بىز لۇغەتتىن «باشلىنىش» دېگەن خەتنى تاپالىشىمىز مۇمكىن، لېكىن لۇغەتتىن «باشلايلى» دېگەننى تاپالامدۇق؟ ياق، تاپالمايمىز. پەقەت «باشلاش، باشلا» دېگەنلەرنى تاپالايمىز، ئارقىسىدىكى قوشۇمچىلارنىمۇ قوشۇشىمىز كېرەك. ئۇنىڭ ئۈستىگە بىز توختىماستىن يېڭى سۆز قوبۇل قىلىشىمىز مۇمكىن، بۇ جەرياندا لۇغەتتە يوق ھەم سۆز ياساش قائىدىمىزگە خىلاپ سۆزلەرمۇ پەيدا بولىدۇ. ئۇ ھالدا بۇنداق سۆزلەرنى ئاپپاراتقا تەڭلىسەك-پەرق ئېتەلمىدىم!- دېسە بۇنىڭدا قانداق بولىدۇ؟
شۇڭا «ھەرپنىڭ بارلىق شەكىللىرى» نى قوشساق ئامبار يېڭىلايمەن دەپ ئاۋارە بولمايمىز، ئۇنىڭ ئۈستىگە ئۇ سۆز مەيلى توغرا بولسۇن ياكى خاتا بولسۇن پەقەت ئۇيغۇرچە ھەرپكە ئوخشىسىلا ئۇنىڭ تەسۋېرىنى پەرق ئېتىپ ئەسلىدىكى ھەرپكە تەقلىدلىيەلەيدۇ. شۇڭا بۇ ocr دېگەن نەرسىنىڭ ئامبىرىغا سۆز قوشۇپ تونۇتۇش دېگەننى ئويلىساق بولمايدۇ، سۆز توختىماي ئاۋۇپ تۇرىدۇ.
[بىز نېمىشقا چەكلىك ئىشتىن چەكسىز ئۈنۈمگە ئېرىشىدىغان يولنى تاللىماي، ئەكىسچە چەكسىز ئىشتىن چەكلىك ئۈنۈمگە ئېرىشىدىغان يولنى تاللىغۇدەكمىز؟ شۇنداققۇ؟]
history0998 ۋاقتى: 2017-5-4 11:44:52
‹‹ocr››نى ماشىنا ئادەملەملەرنىڭ چىراي ياكى جىسىم تونۇشىغا ئوخشاش دەپ چۈشىنىشكە بولامدۇ
wirus ۋاقتى: 2017-5-4 17:23:09
elbilge يوللىغان ۋاقتى  2017-4-28 12:51
بۇنى بىر چاغدا ئۇيغۇرچە ocr نى شىنجاڭ داشۆ ئىشلەۋېتىپتۇ ...

بىز سېتىۋالغان، لېكىن ئىشلىتەلمەي قايتۇرۇۋتتۇق، داۋاملىق ياخشىلىمىسا ئەمەلىي خىزمەتتە ئىشلىتىپ بولغىلى بولمىغۇدەك.
ozugh ۋاقتى: 2017-5-10 00:46:42
مەزكۇر تېمىنىڭ قايتىدىن ئوتتۇرىغا چىققىنى ناھايىتى ياخشى بوپتۇ. مەن ئىلگىرى توردا بىر ئېلكىتاپ ئۇچرىتىپ قالغان، كەسىپ ئەھىللىرى كۆرۈپ باقساڭلار، پايدىلىنىپ قالساڭلار ئەجەپ ئەمەس.
https://share.weiyun.com/bac22752621d6b301010df77ec5b3882
pida138 ۋاقتى: 2017-5-11 17:45:28
ئ‍الىپ تورىدىكى قېرىنداشلارنىڭ كۆرسەتكەن تىرىشچانلىقىغا ئ‍اپرىن ،ماڭا بىر ئىشتا يول كۆرسەتكەن بولساڭلار ،تېلېفون ئارقىلىق پىروگرامما يېزىشنى ئ‍ۈگەنگىلى بۇلامدۇ؟
ozugh ۋاقتى: 2017-5-12 02:12:03
ئۇيغۇرچە ocr تەتقىقاتىغا مۇناسىۋەتلىك بىر قىسىم تەتقىقات ماقالىلىرى:
多字体多字号印刷维吾尔文字符识别
维汉英混排文档识别
印刷维吾尔文本切割
维吾尔文字识别技术中的切分算法研究
印刷体维吾尔文识别后处理
基于滴水算法的印刷体维吾尔文切分方法
印刷体维吾尔文字符切分自适应算法
印刷体维文切分算法的改进--基于像素积分投影法和连通域搜索法
多字体印刷维吾尔文字符识别系统的研究与开发
针对无切分维吾尔文文本行识别字符模型优化
基于模板匹配的印刷维吾尔文字符识别研究
多字体印刷维吾尔文的切分
一种改进的维吾尔文图像倾斜校正方法
基于数学形态学维吾尔文版面分析
印刷维吾尔文特征提取之方向码
维吾尔文扫描页的倾斜校正
一种基于连体段的维吾尔文单词特征提取方法
维吾尔文字符识别系统的设计研究
复杂背景图像中维吾尔文字切分与识别技术的研究
一种基于hmm和统计语言模型的维吾尔文及阿拉伯文识别方法

توردىن بىر قۇر ئىزدەپ كۆرۈشۈمچە، دۆلەت ئىچىدە چىڭخۇا ئونۋىرىستىتىنىڭ پىروففىسورى 丁晓青 (چىڭخۇا زىگۇاڭ ۋىنتوڭ شىركىتىنىڭ قۇرغۇچىسى)، رايونىمىز ئىچىدە بولسا شىنجاڭ ئونۋىرسىتىتىنىڭ پىروففىسورى خالمۇرات غوپۇر مۇئەللىملەر مۇشۇ ساھەدە كۆپرەك ئىزدىنىپتۇ. قىزىققۇچىلار يۇقىرىدىكى ماقالە تىزىملىكى بويىچە تۆۋەندىكى تور بەتتىن ھەقسىز چۈشۈرۈپ كۆرۈپ باقساڭلار بولىدۇ.
http://www.docin.com/
توردىن ئىزدىسەڭلەر مەخسۇس چۈشۈرۈش دېتالى بار، شۇنىڭدا ئېلكىتاپ ھالەتتە چۈشۈرگىلى بولىدۇ.

خالمۇرات مەمەت مۇئەللىمنىڭ تەرجىمھالى:
http://it.xju.edu.cn/info/1143/1390.htm

پىروگراممىرلىقتىن خەۋىرىم بولمىغاچ، قولۇمدىن كەلگەننى قىلغاچ تۇراي دەپ ئازراق ئىزدەپ باقتىم. مەقسىتىم: مۇشۇ بوشلۇقنىڭ بالدۇرراق تولدۇرۇلۇشىنى ئوڭۇمدىمۇ-چۈشۈمدىمۇ ئويلايمەن...
ozugh ۋاقتى: 2017-5-15 00:41:08
تۆۋەندىكىسى يېڭى ئېرا (يەلتاپان) تورىغا 2011-يىلى 1-ئايدا يوللانغان ئۇچۇر ئىكەن. كۆرۈپ بېقىڭلار:
http://www.yaltapan.com/show.asp?id=232

باسما يېزىق پەرىقلەندۈرۈش(OCR)

ئالدىنقى تۇنۇشتۇرۇلغان تېخنىكىللىرىمىز سىزنى قىزىقتۇرالىدىمۇ؟

قانداق بولىشىدىن قەتئىنەزەر دىققىتىڭىز داۋاملىق تور بېتىمىزدە بولسۇن، يېڭى ئېرا يۇمشاق دېتال تەتقىقات مەركىزىمىزنىڭ ئۆزىگە خاس يېڭى تېخنىكىللىرى  باشقىلار بىلەن ئورتاقلىشىش ئۈچۈن  داۋاملىق تۇنۇشتۇرلىدۇ ھەم مەسھۇلاتلاشتۇرلىدۇ شۇنىڭ بىلەن بىرگە تورداشلارنىڭمۇ بىزنىڭ تېخنىكا مەخپىيىتىمىزگە ياتىدىغان سوئاللارنى سورىماسلىقىنى ئۈمۈد قىلىمىز.

تۆۋەندە تۇنۇشتۇرماقچى بولغىنىمىز دەسلەپكى قەدەمدە تاماملانغان، تېخى تولۇق مەشىقلەندۈرۈلمىگەن" باسما يېزىق پەرىقلەندۈرۈش تېخنىكىسى OCR" (رەىسىمدىكى يېزىقنى پەرىقلاندۈرۈش) تېخنىكسى بولۇپ نەچچە يىللار  بولدى، ۋاقىت يار بەرمەسلىك سەۋەبىدىن كومپىيوتېردا ساقلاقلىق تۇردى، بۇنداق بولسا باشقىلارغىمۇ ئۆزىمىزگىمۇ پايدىسى بولمايدىكەن، شۇڭا بۇ تېخنىكىمىزنى تۇنۇشتۇرۇشنى لايىق تاپتۇق.

بىزنىڭ "باسما  يېزىق پەرىقلەندۈرۈش"كە ئۆزىمىزنىڭ چېكىتلىك پەرىقلاندۈرۈش بىلەن قىسمى سۈنئى نېرۋا تورى تېخنىكىمىز قوللىنىلغان بولۇپ، ئەگەر ياخشى مەشىقلەندۈرۈلسىلا تۇنۇش ئۈنۈم يۇقىرى بولىدۇ.

بىزنىڭ  تۆۋەندە كۆرسەتمەكچى بولغان سىناق پروگىرامىمىزدا ساپ يېزىق رەسىمىدىن ياكى ئارلاش (رەسىم ۋە يېزىق بىللە كەلگەن)رەسىمدىن تاللاپ بەرگەن دائىرىنى پەرىقلەندۈرۈش ئىقتىدارى ھازىرلانغان بولۇپ، "باسما  يېزىق پەرىقلەندۈرۈش"نىڭ ئاساسلىق تېخنىكىلىق قىسىمى تاماملىنىپ بولغان، پەقەت رەسىم ئىچىدىن  يېزىق رايونىنى ئاپتۇماتىك تاللاش ئىقتىدارى قوشۇلسا ۋە مۇۋاپپىق مەشىقلەندۈرۈلسىلا مۇكەممەل OCR پۈتۈپ چىقىدۇ.

ئۇنداقتا سىزنىڭ بىزنىڭ بۇ يېڭى تېخنىكىمىزنىمۇ كۆرۈپ باققۇڭىز بارمۇ؟

تۆۋەندىكىسى ئۇنىڭ ساپ يېزىقلىق رەسىمدىن ئۇيغۇرچە تېكىستنى پەرىقلەندۈرۈپ كۆرسىتىش جەريانىنىڭ كەسمە رەسىمى



يۇقارقى رەسىمدە ئۈستىنى تاللاپ قويۇشىمىزدىكى سەۋەب كۆرگۈچىلەرگە ئۈستىنىڭ رەسىم ئىكەنلىكىنى بىلدۈرۈش ئۈچۈن.

بۇ تېخنىكىغا ئېھتىياجى بارلارغا ھەقلىق تەمىنلىنىدۇ ياكى مەبلەغ سېلىشنى خالايدىغانلارغا ياساپ بېرىلىدۇ. ئۆزىمىزنىڭ مەھسۇلاتى سۈپىتىدە  مەھسۇلاتلاشتۇرلىدۇ.

(تورداش؛نېمە ئۈچۈن باشقىلارغا تەمىنلەپ بېرىش تەشەببۇس قىلىنىدۇ؟ئۆزەڭلار ياسىساڭلار بولمامدۇ؟

ج؛ دېتالچىلىقتا ئورتاق تەرەققىي قىلىش ھەمكارلىقنى ئىلگىرى سۈرۈش)
كىرگەندىن كېيىن ئىنكاس يازالايسىز كىرىش | ئەزا بولۇش

سەھىپە جۇغلانما قائىدىسى

ئالپ تور بېتىدە قانۇنغا خىلاپ، سىياسى، دىنىي ، مىللەتلەر ئىتتپاقلىقىغا بۇزغۇنچىلىق قىلىش خاراكتىردىكى ، سېرىق، شەھۋانىي مەزمۇندىكى يازمىلار، ئۈن-سىن، رەسىملەر چەكلىندۇ

ئالپ تور بېتىدە ۋە ئالپ ئۈندىدار سالونىدا يوللانغان مەزمۇنلار ئالپ تورىغا تەۋە، رۇخسەتسىز كۆچۈرۈپ تارقىتىشقا بولمايدۇ. كۆچۈرۈپ تارقاتقۇچىلار بايقالسا قانۇنى مەسئۇلىيتى سۈرۈشتۈرۈلدۇ

特别警告:本网站坚决不允许发表违反国家法律法规的、含有分裂煽动内容的、引起民族矛盾的、破坏民族团结的、带有宗教色彩或有色情的文章

帖子、图片、音视频、电影、歌曲等。若发现将IP地址上报相关部门处理,后果自负。注意自我保护,谨防上当受骗

يانفون نۇسخسى|يانفون تېرمىنالى| ئالپ تورى

新公网安备 65292202000103号

备案/许可证号: 新ICP备13002551号-2

Copyright © 2016-2020 aliptori.com.   All Rights Reserved.

快速
回复
返回
列表
返回
顶部