CSDN专家博客精华版

为人民服务!
  首页  :: 新随笔  :: 管理

电子词典中鼠标取词的原理

Posted on 2007-12-17 11:23  csdnexpert  阅读(327)  评论(0编辑  收藏  举报

 
-- 
※ 来源:·BBS 水木清华站 bbs.net.tsinghua.edu.cn·[FROM: 202.117.20.17] 
发信人: Dreammy (George), 信区: Programming 
标  题: Re: 谁知到电子词典中鼠标取词的原理? 
发信站: BBS 水木清华站 (Thu Nov  6 17:51:06 1997) 
 
【 在 dandan (dandan) 的大作中提到: 】 
:  如题。 
据我所知,解决方案一般有两种,都是针对如何知道当前屏幕任一坐标出的 
字符的 
1.采用截获对部分GDI的API调用来实现,如TextOut , DrawText , TextOutEx等, 
字典对每次写屏操作进行跟踪. 
  技术细节就不赘述乐 
  这种方法也在一些中文系统如中文之星等中采用,另外,有些第三方的字体, 
如ADobe等,也是这个方法(参阅<<Undocumented Windows>>(Andrew Schulman)) 
2.对每个设备上下文(DC)做一分Copy,并跟踪所有修改上下文(DC)的操作 
这种方法更强大,但兼容性不好 
 
实际上,无论那种方法,都有潜在的问题,如第一种方法,它在WIN95下 
时仍是16位方式的(32位技术困难较大),这样就隐含了一个假定:所有 
文本输出的32位API都要通过16位的DLL实现,在WIN95中的确如此,担高版本 
就难说了 
而且即使是第一种方法也容易带来兼容性的问题,比如博雅和中文之星2.0之间就有 
一定的兼容性问题(WIN95下) 
 
 
 
 
-- 
※ 修改:·Dreammy 於 Nov  6 17:57:23 修改本文·[FROM:  166.111.78.230] 
※ 来源:·BBS 水木清华站 bbs.net.tsinghua.edu.cn·[FROM: 166.111.78.230] 
发信人: Gryphon (刘姥姥), 信区: Programming 
标  题: Re: 谁知到电子词典中鼠标取词的原理? 
发信站: BBS 水木清华站 (Thu Nov  6 21:33:32 1997) 
 
【 在 dandan (dandan) 的大作中提到: 】 
:  如题。 
 
    我是听过有人说,但不清楚。 
    具体的情况是:启动抓字程序的时候将GDI库中的TexOut截取出来。 
当Mouse移动到那里后,就取到了。 
    我没做过,可能不正确 
 
-- 
※ 来源:·BBS 水木清华站 bbs.net.tsinghua.edu.cn·[FROM: 166.111.89.244] 
发信人: lshi (海风), 信区: Programming 
标  题: Re: 谁知到电子词典中鼠标取词的原理? 
发信站: BBS 水木清华站 (Thu Nov  6 22:30:48 1997) 
 
【 在 Gryphon (刘姥姥) 的大作中提到: 】 
:      我是听过有人说,但不清楚。 
:      具体的情况是:启动抓字程序的时候将GDI库中的TexOut截取出来。 
:  当Mouse移动到那里后,就取到了。 
:      我没做过,可能不正确 
 
嘿嘿,你说的一点都没错。我最近正想做一个,不知能不能做出来。 
-- 
 
                                             
      
                             雄关漫道真如铁   
                             而今迈步从头越   
                                              
                   ..........好慢好慢啊,而今迈步从头爬 
 
※ 来源:·BBS 水木清华站 bbs.net.tsinghua.edu.cn·[FROM: 202.112.145.96] 
发信人: xiaobo (激情蕴于心中), 信区: Programming 
标  题: 屏幕取词的方法 
发信站: BBS 水木清华站 (Thu Nov 27 01:28:16 1997) 
 
就是“金山词霸”、“博雅”这些词典都有的功能。 
 
今天做了一个实验,终于大致明白它是怎么实现的。 
实验很简单,自己写个程序,在OnPaint()里写一句MessageBeep(-1); 
让PC喇叭发声。 
 
然后运行这个程序和“金山词霸”(“博雅”也一样下面以“词霸”为例), 
当鼠标在自己程序的窗口上停下一会儿(就是取词的等待时间)之后,PC喇叭就会发声, 
同时鼠标也会闪一下。 
 
这说明,鼠标停下之后窗口会重画,这必然是“金山词霸”引起的。 
其目的是好让这个窗口产生API调用,以截取TextOut()、DrawText()等函数。 
这样“词霸”就可以获取该窗口中输出的字符串了,然后再根据鼠标位置作 
判断,就可以得到鼠标所指的字符(单词)了。 
 
这些只是我的推断,不知是否正确,望高手指正。 
 
另外,我还不明白的是该如何截取API调用呢?(这项技术很有用的。) 
GetProcAddress()之后应该用自己的函数取代它,然后再调用原来的吧。 
可是怎么实现呢?请指点一二。 
 
-- 
  江声浩荡,自屋后上升......
 
                            --《约翰.克利斯朵夫》 
 
※ 修改:·xiaobo 於 Nov 27 08:05:21 修改本文·[FROM:   166.111.26.20] 
※ 来源:·BBS 水木清华站 bbs.net.tsinghua.edu.cn·[FROM: 166.111.26.20] 
发信人: xyj (rocky), 信区: Programming 
标  题: Re: 屏幕取词的方法 
发信站: BBS 水木清华站 (Thu Nov 27 08:33:11 1997) 
 
【 在 xiaobo (激情蕴于心中) 的大作中提到: 】 
:  另外,我还不明白的是该如何截取API调用呢?(这项技术很有用的。) 
:  GetProcAddress()之后应该用自己的函数取代它,然后再调用原来的吧。 
:  可是怎么实现呢?请指点一二。 
可以看Matt Pietrek写的<Windows 95 System Programming SECRETS> 
有中译本<Windows 95系统编程奥秘> 
需要了解PE文件格式和系统可执行文件的加载方式! 
偶认为象博雅这样的取词是通过截获系统DLL(可能是GDI)中的TextOut或其 
相关函数来实现的.系统DLL内存地址>0X8000000(2G~4G),为所有 
应用程序共享,地址空间固定,不象0~2G间的内存地址随不同的应用 
程序而切换. 
 
-- 
________________________ 
Rocky 
To be, not to be!!! 
^^^^^^^^^^^^^^^^^^^^^^^^ 
 
※ 来源:·BBS 水木清华站 bbs.net.tsinghua.edu.cn·[FROM: 203.93.44.131] 
发信人: Hmmm (头大如斗然而非常高兴的Hmmm), 信区: Programming 
标  题: Re: 屏幕取词的方法 
发信站: BBS 水木清华站 (Thu Nov 27 09:04:34 1997) 
 
【 在 xiaobo (激情蕴于心中) 的大作中提到: 】 
:  就是“金山词霸”、“博雅”这些词典都有的功能。 
:  今天做了一个实验,终于大致明白它是怎么实现的。 
:  实验很简单,自己写个程序,在OnPaint()里写一句MessageBeep(-1); 
:  让PC喇叭发声。 
:  然后运行这个程序和“金山词霸”(“博雅”也一样下面以“词霸”为例), 
:  当鼠标在自己程序的窗口上停下一会儿(就是取词的等待时间)之后,PC喇叭就会发声, 
:  同时鼠标也会闪一下。 
:  这说明,鼠标停下之后窗口会重画,这必然是“金山词霸”引起的。 
:  其目的是好让这个窗口产生API调用,以截取TextOut()、DrawText()等函数。 
:  这样“词霸”就可以获取该窗口中输出的字符串了,然后再根据鼠标位置作 
:  判断,就可以得到鼠标所指的字符(单词)了。 
:  这些只是我的推断,不知是否正确,望高手指正。 
:  另外,我还不明白的是该如何截取API调用呢?(这项技术很有用的。) 
:  GetProcAddress()之后应该用自己的函数取代它,然后再调用原来的吧。 
:  可是怎么实现呢?请指点一二。 
 
用钩子函数应该就可以。 
有一个叫socket spy的程序就是,做一个API的过滤器。 
-- 
        那天是你用一块红布 
        蒙住我双眼也蒙住了天 
        你问我看见了什么 
        我说我看见了幸福 
         ... 
 
※ 来源:·BBS 水木清华站 bbs.net.tsinghua.edu.cn·[FROM: public.bjnet.ed] 
发信人: xiaobo (激情蕴于心中), 信区: Programming 
标  题: Re: 屏幕取词的方法 
发信站: BBS 水木清华站 (Thu Nov 27 12:03:52 1997) 
 
【 在 Hmmm (头大如斗然而非常高兴的Hmmm) 的大作中提到: 】 
:  用钩子函数应该就可以。 
:  有一个叫socket spy的程序就是,做一个API的过滤器。 
钩子只能过滤消息吧,如何过滤API? 
愿闻其详。 
 
-- 
  江声浩荡,自屋后上升......
 
                            --《约翰.克利斯朵夫》 
 
※ 来源:·BBS 水木清华站 bbs.net.tsinghua.edu.cn·[FROM: 166.111.26.20] 
发信人: ming (忙一阵子静一阵子), 信区: Programming 
标  题: Re: 屏幕取词的方法 
发信站: BBS 水木清华站 (Thu Nov 27 13:48:35 1997) 
 
【 在 youxu (糖猪) 的大作中提到: 】 
:    建议你去 曙光站 编程版看看,有一篇关于修改代码的文章. 
 
我以前在网上取下来过两段代码,可能也是在曙光站看的, 记不清了。 
是在win3.1/95以及NT下屏幕截取的例子。 
 
ftp://166.111.79.141/Internet/Program/guihook.zip & guihooknt.zip 
 
-- 
    圣人忘情     
    最下不及情     
    情之所钟 
    正在我辈 
 
※ 来源:·BBS 水木清华站 bbs.net.tsinghua.edu.cn·[FROM: 166.111.79.141] 
发信人: poncaly (庞卡莱VS机器猫), 信区: Programming 
标  题: Re: 屏幕取词的方法 
发信站: BBS 水木清华站 (Fri Nov 28 14:15:08 1997) 
 
【 在 xiaobo (激情蕴于心中) 的大作中提到: 】 
:  钩子只能过滤消息吧,如何过滤API? 
:  愿闻其详。 
 
  过滤API函数有三种方法。 
 1 做一个DLLLL,在内部实现与被调用APAPI同名的函数,再把这个DDDLL放到系统DDDLL?nbsp;
  前面 
 2 修改AAAPI函数代码,设置断点或用JJJMMMPPP,CCCALLL指令。 
 3 在其他的进程中注入DDDLLLLL,有四种方法 
     1 设置钩子函数 
      2在注册表中进行注册 
       在  中用CCCC函数,不过不适合9595 
       强行注入D, 
 
-- 
※ 来源:·BBS 水木清华站 bbs.net.tsinghua.edu.cn·[FROM: 166.111.5.122] 
发信人: Dreammy (这个杀手不太冷), 信区: Programming 
标  题: Re: 屏幕取词的方法 
发信站: BBS 水木清华站 (Sat Nov 29 13:47:29 1997) 
 
【 在 xyj (rocky) 的大作中提到: 】 
:  可以看Matt Pietrek写的<Windows 95 System Programming SECRETS> 
:  有中译本<Windows 95系统编程奥秘> 
:  需要了解PE文件格式和系统可执行文件的加载方式! 
:  偶认为象博雅这样的取词是通过截获系统DLL(可能是GDI)中的TextOut或其 
:  相关函数来实现的.系统DLL内存地址>0X8000000(2G~4G),为所有 
:  应用程序共享,地址空间固定,不象0~2G间的内存地址随不同的应用 
:  程序而切换. 
这倒没有太大必要,因为博雅或其他字典都是16位的,做起来简单多了 
它们是NE(New Executable) , 离Portable .... 还有点距离 
弟做过一个通用的API钩子模块, 主要的问题没出在这,倒是处理重入(Reentry) 
的问题费了好大力气,还有,它们兼容性不好(如博雅,和CStar),这在我前面的 
一片RE里讨论过 
 
 
-- 
※ 修改:·Dreammy 於 Nov 29 14:06:36 修改本文·[FROM:   166.111.91.63] 
※ 来源:·BBS 水木清华站 bbs.net.tsinghua.edu.cn·[FROM: 166.111.91.63] 
发信人: xyj (rocky), 信区: Programming 
标  题: Re: 屏幕取词的方法 
发信站: BBS 水木清华站 (Mon Dec  1 10:13:39 1997) 
 
:  : 偶认为象博雅这样的取词是通过截获系统DLL(可能是GDI)中的TextOut或其 
:  : 相关函数来实现的.系统DLL内存地址>0X8000000(2G~4G),为所有 
:  : 应用程序共享,地址空间固定,不象0~2G间的内存地址随不同的应用 
:  : 程序而切换. 
:  这倒没有太大必要,因为博雅或其他字典都是16位的,做起来简单多了 
:  它们是NE(New Executable) , 离Portable .... 还有点距离 
:  弟做过一个通用的API钩子模块, 主要的问题没出在这,倒是处理重入(Reentry) 
:  的问题费了好大力气,还有,它们兼容性不好(如博雅,和CStar),这在我前面的 
:  一片RE里讨论过 
:   
Sorry,前一篇没有说清楚! 
Win95下的GDI的核心代码是16位的,GDI32只是GDI16的一个外壳, 
所有象跛鸭之类的16位字典可以运行. 
由于GDI32处理了重入问题,因此在HOOK了GDI16的函数时,运行32位程序 
应该没有重入问题,但16位的恐怕就有些问题! 
 



Trackback: http://tb.blog.csdn.net/TrackBack.aspx?PostId=3160