RSS
 

Archive for the ‘60.文摘’ Category

文摘:黑城

09

黑城遗址位于内蒙古自治区额济纳旗达赖库布镇东南约35公里、纳林河东岸荒漠中。为西夏黑水城和元代亦集乃路城址,蒙古语为哈日浩特,意即“黑城”。现存城墙为元代扩筑而成,平面为长方形,东西长434米,南北宽384米,周围约1600米,最高达10米,东西两面开设城门,并加筑有瓮城。城墙西北角上保存有高约13米的覆钵式塔一座,城内的官署、府第、仓敖、佛寺、民居和街道遗迹仍依稀可辨。城外西南角有伊斯兰教拱北一座,巍然耸立地表。

“居延”一词为匈奴语,其意为“天”。居延地区原为匈奴牧地,19岁的大汉将军霍去病大破匈奴后汉朝曾在这里屯兵戍边,创造了居延地区灿烂的汉文明。汉后这里的文明断断续续、起起伏伏,战争的创伤浸透了弱水河畔。

时至公元1038年,党项族建立的西夏国在这里设立“威福军司”,这是居延文明的又一次高潮,也是这里成为如今西夏文化研究重要线索的原因。1226年,成吉思汗蒙古军第四次南征攻破黑城,1286年元世祖在此设“亦集乃路总管府”,这里成为中原到漠北的交通枢纽,马克波罗就是沿着这条古道走进了东方天堂。

1372年,明朝征西将军冯胜攻破黑城后明朝随即放弃了这一地区,此后黑城便在尘封的历史里沉睡了的近700年。1886年,俄国学者波塔宁在额济纳考察时发现了黑城。1908年4月,俄国探险家科兹洛夫在这里掘得大量西夏文物,其中包括珍贵的汉文、夏文对照的《番汉合时掌中珠》及《音同》、《文海》等古籍,这一重大的考古发现和掠夺行径轰动考古界和史学界……

黑城平面为长方形,周长约1公里,东西434米,南北384米,两墙中部开设城门并加筑有瓮城。城墙用黄土夯筑而成,残高约9米。城西北角建有一覆钵式喇嘛塔,原有的街道和主建筑依稀可辨,四周古河道和农田的残貌仍保持其轮廓。沙漠已经快将这里吞噬,黑城里面还埋藏有多少珍宝是一个未解之谜,但它给人类带来的思考绝不应该仅仅是珍宝……

虽然黑城因水源枯竭早在14世纪中期就已成为沙海中的孤城残址了,但两千年前开辟的丝绸之路的北线——居延北线,就在黑城附近通过,因而黑城仍有极高的考古价值。

2001年06月25日,黑城遗址作为夏至元时期建筑,被国务院批准列入第五批全国重点文物保护单位名单,归入居延遗址项中。

 

文摘:公司绝不会告诉你的20大秘密

16

1.入职时的工资高低不重要,只要你努力工作你会得到相应待遇的

我估计几乎找过工作的人都听过这句话,当我们确定被聘用跟公司谈工资时,他们都会说“如果以后你业绩突出、努力工作,你的报酬也会相应增加的”,特别是当第一次找工作的时候大多数人会相信这些话,但是千万~~别相信。

Read the rest of this entry »

 

讨人喜欢的28个原则

14


  1. 长相不令人讨厌,如果长得不好,就让自己有才气;如果才气也没有,那就总是微笑。

  2. 气质是关键。如果时尚学不好,宁愿纯朴。

  3. 与人握手时,可多握一会儿。真诚是宝。

  4. 不必什么都用“我”做主语。

  5. 不要向朋友借钱。

  6. 不要“逼”客人看你的家庭相册。

  7. 与人打“的”时,请抢先坐在司机旁。

  8. 坚持在背后说别人好话,别担心这好话传不到当事人耳朵里。

  9. 有人在你面前说某人坏话时,你只微笑。

  10. 自己开小车,不要特地停下来和一个骑自行车的同事打招呼。人家会以为你在炫耀。

  11. 同事生病时,去探望他。很自然地坐在他病床上,回家再认真洗手。

  12. 不要把过去的事全让人知道。

  13. 尊敬不喜欢你的人。

  14. 对事不对人;或对事无情,对人要有情;或做人第一,做事其次。

  15. 自我批评总能让人相信,自我表扬则不然。

  16. 没有什么东西比围观者们更能提高你的保龄球的成绩了。所以,平常不要吝惜你的喝彩声。

  17. 不要把别人的好,视为理所当然。要知道感恩。

  18. 榕树上的“八哥”在讲,只讲不听,结果乱成一团。学会聆听。

  19. 尊重传达室里的师傅及搞卫生的阿姨。

  20. 说话的时候记得常用“我们”开头。

  21. 为每一位上台唱歌的人鼓掌。

  22. 有时要明知故问:你的钻戒很贵吧!有时,即使想问也不能问,比如:你多大了?

  23. 话多必失,人多的场合少说话。

  24. 把未出口的“不”改成:“这需要时间”、“我尽力”、“我不确定”、“当我决定后,会给你打电话”……

  25. 不要期望所有人都喜欢你,那是不可能的,让大多数人喜欢就是成功的表现。

  26. 当然,自己要喜欢自己。

  27. 如果你在表演或者是讲演的时候,如果只要有一个人在听也要用心的继续下去,即使没有人喝采也要演,因为这是你成功的道路,是你成功的摇篮,你不要看的人成功,而是要你成功。

  28. 如果你看到一个贴子还值得一看的话,那么你一定要回复,因为你的回复会给人继续前进的勇气,会给人很大的激励。同时也会让人感激你。网站编辑发一篇好文章不容易,如果你也觉得好,就尽量发表评论来鼓励一下!

 
1 Comment

Posted in 60.文摘

 

转:相声师承关系,九代传人

24

其中标有(德云社)字样的一部分是我按照郭德纲系列相声中介绍加上的。


第一代——第二代
张三禄——朱绍文、阿彦涛、沈春和


第二代——第三代
朱绍文——春长隆、冯崑治、范长利、桂祯、徐长福、沈竹善
阿彦涛——恩绪、高闻奎
沈春和——魏昆治、王有道、李长春、高闻元、裕二福


第三代——第四代
恩绪——李德钖、李德祥、张德泉、华子元、来德如、王葆山、广阔泉、高玉峰、谢芮芝、骆采舞、戴致斋
桂祯——裕德隆、玉来子
徐长福——焦德海、徐茂昌、刘德智
冯崑治——高德明、吉坪三、高德光、高德亮、常葆臣、郭伯山
春长隆——马德禄
高闻元——唐玉福、李万兴、张杰尧、韩子康、刘月樵
范长利——周德山、郭瑞林、李瑞丰、张德俊、杜茂林、徐瑞海、朱凤山、马良臣
魏崑治——张伯俊、丁伯品、阎伯山
李长春——恒瑞丰
沈竹善——冯振声、孙伯珍、卢德俊、张星武、范瑞亭


第四代第五代
裕德隆——王兆麟、陶湘如、李少卿、张云武、张绍堂、吴景春
李德钖——马桂元、玉小亭、焦葆奎、郑仲衡
焦德海——张寿臣、李寿增、富寿严、李寿清、叶寿亭、于俊波、常连安、朱阔泉、汤金澄、于堃江、尹凤岐、彦授辰、路彩祥、白葆亭
卢德俊——赵霭如、陈雨亭、赵寿舫、何寿亭、崇寿峰、冯乐福、金钰堂、何玉清、庞子泉、李得子
周德山——马三立、刘桂田、李桐文、连秀全、宝寿华、魏常玉
马德禄——高寿亭、高桂清、杨闻华、尹寿山、郭荣起
范瑞亭——焦寿海、陈桂林、陈桂鑫、聂闻治、冯子玉
郭瑞林——侯一尘、谭伯如、陶湘九、李寿芳、马四立、胡兰亭
李瑞丰——寇寿亭、董湘臣、陈紫荃
李德祥——马寿岩
吉坪三——秦醒民、熙醒生
刘德智——郭启儒、张春奎
冯振声——常福荃、杨海荃、韩小痴、叶太珍、祝景荃、张闻斌
张杰尧——单松亭、关松明、袁松麒、班松麟、田松山、刘松江、辛松斌、郑松涛、陈松波、杨松临、王松声、王松葵
马良臣——李永春
高德明——于佑福、冯大荃、张松青
朱凤山——阚天忠、谢天荣、赵天寿、李天林、杨天茂
高德亮——高凤山、赵玉贵


第五代——第六代
张寿臣——赵立梧、常宝堃、刘宝瑞、刘化民、康立本、叶立中、冯立樟、朱相臣、冯立全、袁佩楼、沈君、张少清、穆祥林、于世德、胡振江、戴少甫、侯少尘、邢炳涛、田立禾、佟大方、张嘉利
焦寿海——赵佩茹、刘奎珍、李洁尘、耿宝林、张宝珍、刘广义、孙宝琦、杨绍奎、佟浩如、张宝玙、李存民、张福祥、张玉堂、李润杰、张明新、崔怀禄、赵稳增、张立林、张宝珠
李寿增——孙少林、赵兰亭、欧宝灿、王树田、张振圻、汤一民、张佩如、曹宝春、夏万福、马金良、来少如、焦立海、丁守义、刘玉凤
马三立——阎笑儒、张笑勤、张笑非、金笑天、班德贵、连笑昆、常宝华、高笑临、谌笑宇、王笑予、方笑文、任笑海、尹笑声、于宝林、常宝丰
常连安——高元钧
马桂元——冯宝华、赵宝贵、骆宝珊
朱阔泉——王凤山、李宝麒、侯宝林、王宝童、马志明
侯一尘——连春仲、常宝霖、关春山、赵春田、马敬伯、于春藻、张世芳
赵霭如——王长友、孙宝才、罗荣寿、黄鹤来、李桂山、王闻禄、李延年、张喜林、何善平、张善曾
于俊波——曲福恩、白全福、郭全宝、孙玉奎、白家林
吴景春——吴苹
富寿严——靳宝琏
高桂清——冯立铎、史文翰、关立铨、张立森
汤金澄——王俊
郭启儒——全常保、于连仲、邵其炳、齐信英
尹寿山——边振新
聂闻治——郑祥泰
李少卿——李宝璋、武奎海、刘聘臣、张闻得、刘宝森
赵寿舫——张永熙、陈宝泰
陈雨亭——王世臣
郭荣起——常宝霆、郭宝明、杜三宝、杨少华、谢天顺、张宝如
崇寿峰——李宝山、关宝奇、付海峰
何寿亭——王福田、张庆森、于春明、顾海泉
谭伯如——陈涌泉、赵世忠、王春和、张春旺、王嘉琪、寇连荣
陶湘九——郭宝珊、马宝璐、杨宝璋、王宝珍、田宝珩、张兴华、王宝珏、秦宝琦、徐宝瑜、郭宝瑛、关立铭
李寿芳——刘伯奎
高寿亭——刘立升、孙少臣
连秀全——王本林、刘志远
熙醒生——师世元
马寿岩——龚玉章、田宝鑫、张春生、回婉华、王枢祥
杨海荃——赵幼樵、富兰英、马子恒、王海江、杨金声、周印金、汤艳杰、金炳昶、王志涛、杨振华、冯景顺、张乃勤
常福荃——刘来子、董小柱、魏幼臣、刘幼山
叶太珍——蔡玉衡
祝景荃——金幼实、陈幼新、高幼峰、李幼刚、冯幼封
彦授辰——张鸿滨、高凤起、胡仲仁、李宝森、孙宝钧、戴宝康、孙桐增、绪得贵
杨松临——高飞、祁喜生、陈尚忠、李祝英、林茂、陈冠义
冯大荃——邓世杰
张松青——陈世魁、麻世豪
高凤山——毕学祥、李学宏、陈学富、石富宽、李学贵、崔琦、来宝刚
李得子——朱永福
李永春——崔亚轩


第六代——第七代
赵佩茹——李伯祥、张伯华、马伯林、崔伯光、杨伯英、高英培、常贵田、刘英华、杨英彩、李世增、李英杰、王祥林、马志存、徐德奎、张继英、任鸣起、刘英奇、张奎清、张义勤、李浩然、郭士中、侯耀文、许秀林、刘国器
吴苹——藤田香
崔亚轩——刘沛起
庞子泉——夏福义
康立本——李文锦、董铁良
赵兰亭——张文甫、孙士达、刘黎
关宝奇——祁存才
龚玉章——王鸣山
常宝堃——李伯仁、苏文茂
李洁尘——赵心敏、王伯荣、秦玉华、马文忠、姜宝林
王长友——赵振铎、郭文岐、丁玉鹏、叶少臣、茹少亭、韩秀英、寇庚杰、范传辅、康松广、臧洪、赵亮
刘宝瑞——周文游、寇庚儒、邢文昭(1961年拜师,德云社)、霍文龙、殷文硕、王惠林、高洪顺、唐杰忠、张庭萱、曹中民、刘兵、皮树德、王文林(德云社)
侯宝林——贾振良、黄铁良、杨紫阳、马季、李文山、胡必达、殷培田、贾冀光、丁广泉、康达夫、李如刚、吴兆南、于世猷、郝爱民、师胜杰
杨绍奎——丁文元、刘文亨、任文立、刘文贞、张文学、张文习、王文进、李文芳、刘文步(12岁拜师,德云社)、赵文岚、张文辉、姜伯华、潘庆武、孙福海、彭凤林
孙宝才——孙星海、赵连升、王长林、马文光、丁文盛、刘孝先、福保仁、王学义、陈进山、王世勇
常宝霖——王庆新、张洪刚、姬晓廷
罗荣寿——杨文义、兰文甫、丁金声、刘树江、李树仁、张树茂、王庆东、凌少明、李国英、李国盛、杨瑞库、王得昌、马维福、郭祥林、马俊生、张盘、张鲁、丁广和
杨宝璋——金文和、范文欣、余文光、李文枫、黄文斌
王宝童——殷振江、林文春、贾世泉、郭仁金
陈涌泉——刘辰、王辅廷、陈庆昇
关春山——刘文亮、韩文光、田文明、辛文涛
耿宝林——方伯华、王伯林、张伯涛、左春来、王占友、吕维国、朱贞富、王文喜
王世臣——李鸣歧、赵得亮、马大龙、付振江、孟祥光、刘洪沂
张玉堂——李文成、包文年、李文娱、许文跃
王本林——郑小山、王小生、连小林
张佩如——王文凯、张保明、孙保光、张兴海
张振圻——王洪文、王文玉、佟守本
于宝林——王鸣楼、吴文龙、陈鸣志、邓继增、李勇、陈文彦、辛克正、李崇武、佟有为、马树春、赵恒、宫兰欣
武魁海——陈文光、席香远、苗文浩、车文通、魏文华、魏文亮、张文霞、刘曼影、李世续
常宝霆——王英俊、王英杰、黄英玉、郝英辰、曲乃新、王佩元
张庆森——杜国芝、郑福山、李金宽
朱相臣——韩刚甲、蔡培生、师胜杰(后拜师侯宝林)、马洪信
连笑昆——王雅福、王雅青、王雅育、张雅璐、杨雅松、刘雅奎、张雅升、张雅成
白全福——杨志刚、房国群、缴月舒、杨志光、阿双全、王吉祥、张志宽、李国权、崔长武、吴云林、周桂林、阎金城、张文琪、张伯勋、宋勇、白龙岩、金兆庆、刘学仁
刘化民——朱君贵、张建忠
阎笑儒——宋文俊、杨世章、陈永清、陈永忠、陈永海、佟文阔、潘海波、侯长喜
田立禾——耿伯扬、赵广山
马敬伯——王文奇、陈秉文、徐景信、孙得一、刘威
班德贵——范振钰、夏志恒、耿文卿
刘聘臣——杨稚敏、靳金来、刘颖
全常保——郑文喜、郭文寿
李桂山——叶文杰
王闻禄——魏美玉、郭淑华、刘万山
于春明——高秀琴、马凌云、金涛、董启威、王志民、庄佩臣、戴福月、果树青、戚松、刘加柯、王成启、张千、王之甫、
李凤鸣
郭全宝——王文砚、汪宝琦
陈宝泰——马文瑞
佟大方——姚玉明、张文顺(德云社)
尹笑声——王文厚、杨威
常宝丰——马洪信
靳宝琏——孔文敬、刘文德、夏文化
欧宝璨——董长禄、刘长声、杨长鸣、隋长欣
关立铨——马文强
王嘉琪——王鸣义、康桂生
王树田——史文惠、郭文超、肖声虎、王信、杨世龙
徐宝瑜——黄文祥、滕文超、万文英
常宝华——牛群、赵福玉、包长春、奇志(后拜师侯耀文)、冯翊纲、宋少卿
袁佩楼——孟文辉、张存珠、赵辈亭、李富荣、朱庆山
王凤山——唐文光、郑文昆、周志光、方志清、李连伟、马六甲、张金玉
张永熙——吕少明、梁尚义、李国先、孙庆淮、曹庆波、吴庆涌、言庆洋、孙庆池、郎庆浪、吴庆鸿、张庆济
马志明——黄族民、潘贵才、王金东、卢福来、于克志
赵春田——张学彦、徐保库、冯永志、刘流、刘杰、张继贤、梁洪才、侯孝才
李润杰——王印权
夏万福——潘龙浩
高笑临——吴伟申、朱文先、杨文峰、王文博、吴新安、吴棣
孙少臣——魏务良
赵世忠——冯洋、马魁尧、杜宏圻、康友纯、张志强
孙宝钧——杜培玉
张宝如——赵保成、李增年、郭得喜
张宝玙——夏文升
马宝璐——李文立
刘宝森——张文明
回婉华——牛振华
刘伯奎——赵连功
赵天寿——费殿臣
谢天荣——王校林
王宝珍——陈国华
高元钧——李立山、石小杰、魏兰柱
王福田——李文荣、陶文华、常佩业(后拜师马季)、苏连生、周琪
于笑澜——王文昌、陈文潇、张文茹、邓文丰、李文英、于文海、吴文龙、姚文虎、关文庆、李文勇、辛文正、雷文顺、马文孝、赵文浩、陈文彦
于世德——白英杰、韩光、张书新、马伟国
叶立中——曹俊清、朱文正
穆祥林——谢树森、丁振雨、郭嘉强、李文珊、陈世智
郭宝珊——王启禄、黄文忠、陆文荣、施文琳
郭宝瑛——田文奎
彭国良——陈连仲
师世元——高金奎、方金亮、曹金星
杨少华——唐传模、朱永义、张永久、陈君志
张善曾——白晓芳
赵宝贵——纪文奎
冯立樟——赵传璋、穆瑞庆、王锦文、李凤山、王东林
张嘉利——王鸣禄、谭鸣亮
任笑海——关自仁
冯宝华——王文杰、邢文伯、程光德
孙少林——赵文启、王少安、郭春堂、王文元、肖国光、王文豪、韩广海、孙春华
杨振华——李兴国、纪元
赵幼樵——巩固
金炳昶——张广发、张东波、孙国伟、金珠
王志涛——耿炎、刘江舸
石富宽——于谦(1985年拜师,德云社)
绪得贵——付宝山、辛宝珊
冯立铎——张兴汉、陈东国
张喜林——刘庆福、李业明、赵小林、冯春岭、胡伟新


第七代——第八代
赵心敏——张宏、吕闻升、华士泉、杨贵田
董长禄——欧光慈
马季——姜昆、赵炎、刘伟、冯巩、笑林、王谦祥、李增瑞、韩兰成、刘喜尧、彭子义、常佩业、黄志强、黄宏、尹卓林、姚新光、李国修、赵龙军、邢瑛瑛、刘立新、侯冠男
王长林——于海伦、刘义学、朱周义
李立山——杨进明、王林
姜宝林——宋雁波、侯连友、李志强
赵振铎——李金斗、王文友、肖巍、贾承伯
魏文亮——李相友、罗峰
刘文亨——高吉庆、马云路、高顺来、陶大为
刘文步——李明刚
苏文茂——赵伟洲、武福星、吉马、郭新、黄运成、刘俊杰、苏士杰、崔金泉、宋德全
唐杰忠——张茂起、李建华、李艺、刘全刚、李金祥、赵斌、崔喜跃、杨宁、巩汉林、魏真柏、朱琦、汪声亚、杨祖尧、卡尔罗、马洛、罗爱恬、白玉、周伟
张文甫——刘玉辉
丁广泉——连春建、郝莲露、常亮、马马杜、莲娜、玛丽娜、阿努拉、董漠涵、莫里斯、伊丽沙白、石桥久弥、李佳骏、龚哲平、米雷娜、李霁霞、马震
金文和——徐祖国、郭伦、张玉琪
朱文正——孙继忠
史文惠——杨四奇、赵晶
王雅福——刘际(后拜师侯耀文)、沙跃生
李文成——杨常州、王常柱
郭文歧——王少林、李玉君
刘文亮——马洪海、刘洪江、杨洪滨、韩笑
王学义——李士琦、李中华、段军
丁玉鹏——王蓬
杨紫阳——仇君
戴福月——高东明、于化民
王锦文——冯敏山、果克、陈庆、刘玉才
赵连升——赵荣全
郑小山——魏元成、罗健
贾世泉——李伟、王平
刘加柯——刘科
孙世达——严玉林、童鸣、叶杰平
范振钰——赵津生、腾生祥、彭华、于志勇、郭伯良、何世铭、王传林、丛波、杨俊杰、马腾翔、刘春山、张德起、高峰(德云社)
陈永忠——元春起
赵传璋——周洪儒
殷培田——蒋明孝
林文春——李铎
李伯祥——刘继深、郑健、戴志诚、刘毛毛、李增满、高玉林、耿直、王平、孙承林、孙强、高吉林、金旺
高英培——苏明杰、李松岩、高青、吴健、鲁少华、孟凡贵、赵保乐、李嘉存、韩翔、李志刚、杨天立、朱强、刘显东、吴金富、傅向波
马志存——马洪升、赵传真、王宏
王文进——战暑日、孙殿盛、王元锋
徐德奎——刘树青、刘金瑞、吴刚伦、陈治华
王印权——叶景林、李少泉
张志宽——王影贤、马政
宋勇——周静
施文琳——李刚、齐力新、孙欣梅
黄文忠——秘鸿泉
陆文荣——曹鸿伟
李国盛——赵新华、刘廷凯
金幼峰——隋广斌、王泽民、李平
赵连功——王琪
高金奎——高滨江
王小生——甄靖
左春来——陈树桐
孙兴海——秦玉贵
贾冀光——张大礼、王茵
刘洪沂——李伟建、甄奇
吴兆南——江南、侯冠群、刘增锴、郎祖筠、刘尔金、樊光耀
侯耀文——贾伦、牛成志、单联丽、王荃、高玉庆、李炳杰、陈寒柏、李福盛、郭秋林、刘际、奇志、姜桂成、刘捷、王玉、郭晓小、荆林野、郭德纲(2004年拜师,德云社)
殷文硕——高迪艺、郭迪传、白迪瀚、邢迪海、荣迪曲、马迪飞、刘迪天、徐迪建、帕迪西、李迪振、李迪域、赵迪兴、杨迪中、阿迪华、任迪山、郭迪业、刘岩
康达夫——张新华、郭铁林
许秀林——朱军
吕少明——马济江、董树良、钱麟、祁乾宁
师胜杰——刘彤、邹德江、王敏、王刚、侯军、刘伟、王海、张充、何树成、周威
杨志刚——徐永刚、夏景华、邳建新、牟玉春、马云翔
关自仁——刘建平、刘跃宁、乔国庆
张文顺——徐德亮(2002年拜师,德云社)、张德武(德云社)


第八代——第九代
李金斗——刘颖、大兵、毛威、韩冰、刘畅、付强、方清平、王政
李建华——武宾、李冲、满昱
王谦祥——郭培鑫
赵津生——周旭
武福星——丁冬
孟凡贵——刘艺
崔金泉——王越、辛曲、穆全、沈世鹏、李彬、张滦
刘喜尧——柏迈高
奇志——何晶晶
姜昆——刘惠、白桦、邓小林、大山、刘全利、刘全和、赵卫国、李道南、陆鸣、许勇、夏文兰、倪明、唐爱国、齐立强、句号、徐文、郭丹、曹曙光
孟凡贵——刘云天(11岁拜师,德云社)
杨进明——李云杰(德云社)
郭德纲——潘云侠(德云社)、何云伟(德云社)、曹云金(2002年拜师,德云社)、孔云龙(2004年拜师,德云社)、岳云鹏(2004年拜师,德云社)、栾云平(德云社)、朱云峰(2004年拜师,德云社)

 
2 Comments

Posted in 60.文摘

 

教育见闻(转)

20

1979年6月,中国曾派一个访问团,去美国考察初级教育。回国后,写了一份三万字的报告,在见闻录部分有四段文字:


一、学生无论品德优劣、能力高低,无不趾高气扬、踌躇满志,大有“我因我之为我而不同凡响”的意味。


二、小学二年级的学生大字不识一斗,加减乘除还在掰手指头,就整天奢谈发明创造,在他们手里,让地球翻调个头,好像都易如反掌。


三、重间、体、美,而轻数、理、化,无论是公立还是私立学校,音、体、美活动无不如火如荼,而数、理、化则乏人问津。


四、课堂几乎处于失控状态,学生或挤眉弄眼,或谈天说地,或跷二郎腿,更有甚者,如逛街一般,在教室里摇来晃去。


最后,在结论部分,是这么写的:美国的初级教育已经病入膏肓,可以这么预言,再过20年时间,中国的科技和文化必将赶上和超过这个所谓的超级大国。


在同一年,作为互访,美国也派了一个考察团来到中国。他们在看了北京、上海、西安的几所学校后,也写了一份报告,在见闻录部分也有四段文字:


一、中国的小学生在上课时喜欢把手放在胸前,除非老师发问时,举起右边的一只,否则不轻易改变;幼儿园的学生则喜欢把手背在后面,室外活动时除外。


二、中国的学生喜欢早起,七点钟之前,在中国的大街上见到的最多的学生,并且他们喜欢边走路边用早点。


三、中国学生有一种作业叫“家庭作业”,据一位中国老师解释,它的意思是“学校作业在家庭的延续”。


四、中国把考试分数最高的学生称为学习最优秀的学生,他们在学期结束时,一般会得到一张证书,其他人则没有。


在报告的结论部分他们是这样写的:中国的学生是世界上最勤奋的,在世界上也是起得最早、睡得最晚的;他的学习成绩和世界上任何一个国家的同年级的学生比较,都是最好的。可以预测,再用20年时间,中国在科技和文化方面,必将把美国远远甩在后面。


25年过去了,美国“病入膏肓的教育制度”共培养了几十位诺贝尔奖得者和一百多位知识型的亿万富豪,而中国还没有哪一所学校培养出一名这样的人才。


两家的预言都错了

 
 

【技术新闻】转贴:Windows or Linux?并非由成本或安全性决定

05

  据国外媒体报道,全球最大的主机托管商之一Rackspace最近对它的客户进行了调查,结果发现企业的开发人员更熟悉何种开发环境以及哪种系统的集成工具更容易购买是决定用户选择何种操作系统的最主要因素。


  Rackspace共管理超过13000台服务器,其中55%的服务器使用Linux系统,其余的都使用Winodws系统。使用Winodws系统的服务器比较常用的是Windows 2000和Windows Server 2003系统。该公司在2005年还成为了微软公司服务器的托管商。


  由于需要管理这两种不同种类的服务器,因此Rackspace对于Linux和Winodws系统都有较深的了解。他们表示,此次的调查目的并不是为了说明哪种操作系统更优秀。


  Rackspace通过E-mail对该公司的1978名客户进行了调查。结果调查发现,用户虽然关心操作系统的安全性和开发成本,但是这些却不是他们在选择操作系统时所考虑的最主要问题。


  在调查中,有92%的Linux用户和60%的Windows用户认为Windows更容易遭到攻击,但是他们也承认这不是选择操作系统的最主要因素,而Windows服务器也是Rackspace业务增长最快的部分。


  用户还表示,系统是否安全并不完全取决于系统本身,起主要作用的是应用环境、内部进程和操作人员的素质。


  调查还显示成本不是用户考虑的最主要因素。有50%的Windows用户和70%的Linux用户认为Linux的总拥有成本(TCO)低于Windows系统。


  事实上,Rackspace还发现Windows和Linux的系统授权费用基本上是持平的。虽然Windows系统会因安装其它软件和购买额外的硬件而多花费20%的费用,但是在进行系统功能扩充时Windows的花费呈线性增长比较容易预计,而Linux的费用增长方式则复杂的多,一般很难预计。


  通过调查,Rackspace最终得出结论认为企业用户在选择服务器的操作系统时主要是由中间件、数据库和程序员的开发水平决定的。


  也就是说,虽然用户认为Windows的安全性较差,但是由于考虑到程序员更熟悉Windows下的程序开发,而且Windows的相关集成工具更容易买到。因此他们会选择Windows系统,而不是安全性较高的Linux系统。


  此外,调查还发现决定购买何种操作系统主要是由应用开发者和IT部门来决定的,而企业高层一般不会过问此事。在所有接受调查的客户中,只有24%的人表示主管部门会干涉选择何种操作系统。

 
 

Lucene简介

29

在应用中加入全文检索功能
    ——基于Java的全文索引引擎Lucene简介


作者: 车东 Email: chedongATbigfoot.com/chedongATchedong.com


写于:2002/08 最后更新:

关键词:Lucene java full-text search engine Chinese word segment


内容摘要:


Lucene是一个基于Java的全文索引工具包。



  1. 基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史
  2. 全文检索的实现:Luene全文索引和数据库索引的比较
  3. 中文切分词机制简介:基于词库和自动切分词算法的比较
  4. 具体的安装和使用简介:系统结构介绍和演示
  5. Hacking Lucene:简化的查询分析器,删除的实现,定制的排序,应用接口的扩展
  6. 从Lucene我们还可以学到什么

基于Java的全文索引/检索引擎——Lucene


Lucene不是一个完整的全文索引应用,而是是一个用Java写的全文索引引擎工具包,它可以方便的嵌入到各种应用中实现针对应用的全文索引/检索功能。


Lucene的作者:Lucene的贡献者Doug Cutting是一位资深全文索引/检索专家,曾经是V-Twin搜索引擎(Apple的Copland操作系统的成就之一)的主要开发者,后在Excite担任高级系统架构设计师,目前从事于一些INTERNET底层架构的研究。他贡献出的Lucene的目标是为各种中小型应用程序加入全文检索功能。


Lucene的发展历程:早先发布在作者自己的www.lucene.com,后来发布在SourceForge,2001年年底成为APACHE基金会jakarta的一个子项目:http://jakarta.apache.org/lucene/


已经有很多Java项目都使用了Lucene作为其后台的全文索引引擎,比较著名的有:



  • Jive:WEB论坛系统;
  • Eyebrows:邮件列表HTML归档/浏览/查询系统,本文的主要参考文档“TheLucene search engine: Powerful, flexible, and free”作者就是EyeBrows系统的主要开发者之一,而EyeBrows已经成为目前APACHE项目的主要邮件列表归档系统。
  • Cocoon:基于XML的web发布框架,全文检索部分使用了Lucene

  • Eclipse:基于Java的开放开发平台,帮助部分的全文索引使用了Lucene


对于中文用户来说,最关心的问题是其是否支持中文的全文检索。但通过后面对于Lucene的结构的介绍,你会了解到由于Lucene良好架构设计,对中文的支持只需对其语言词法分析接口进行扩展就能实现对中文检索的支持。


全文检索的实现机制


Lucene的API接口设计的比较通用,输入输出结构都很像数据库的表==>记录==>字段,所以很多传统的应用的文件、数据库等都可以比较方便的映射到Lucene的存储结构/接口中。总体上看:可以先把Lucene当成一个支持全文索引的数据库系统


比较一下Lucene和数据库:


















Lucene 数据库
索引数据源:doc(field1,field2…) doc(field1,field2…)
\ indexer /
_____________
| Lucene Index|
————–
/ searcher \
结果输出:Hits(doc(field1,field2) doc(field1…))
 索引数据源:record(field1,field2…) record(field1..)
\ SQL: insert/
_____________
| DB Index |
————-
/ SQL: select \
结果输出:results(record(field1,field2..) record(field1…))
Document:一个需要进行索引的“单元”
一个Document由多个字段组成
Record:记录,包含多个字段
Field:字段 Field:字段
Hits:查询结果集,由匹配的Document组成 RecordSet:查询结果集,由多个Record组成

全文检索 ≠ like “%keyword%”


通常比较厚的书籍后面常常附关键词索引表(比如:北京:12, 34页,上海:3,77页……),它能够帮助读者比较快地找到相关内容的页码。而数据库索引能够大大提高查询的速度原理也是一样,想像一下通过书后面的索引查找的速度要比一页一页地翻内容高多少倍……而索引之所以效率高,另外一个原因是它是排好序的。对于检索系统来说核心是一个排序问题


由于数据库索引不是为全文索引设计的,因此,使用like “%keyword%”时,数据库索引是不起作用的,在使用like查询时,搜索过程又变成类似于一页页翻书的遍历过程了,所以对于含有模糊查询的数据库服务来说,LIKE对性能的危害是极大的。如果是需要对多个关键词进行模糊匹配:like”%keyword1%” and like “%keyword2%” …其效率也就可想而知了。


所以建立一个高效检索系统的关键是建立一个类似于科技索引一样的反向索引机制,将数据源(比如多篇文章)排序顺序存储的同时,有另外一个排好序的关键词列表,用于存储关键词==>文章映射关系,利用这样的映射关系索引:[关键词==>出现关键词的文章编号,出现次数(甚至包括位置:起始偏移量,结束偏移量),出现频率],检索过程就是把模糊查询变成多个可以利用索引的精确查询的逻辑组合的过程。从而大大提高了多关键词查询的效率,所以,全文检索问题归结到最后是一个排序问题。


由此可以看出模糊查询相对数据库的精确查询是一个非常不确定的问题,这也是大部分数据库对全文检索支持有限的原因。Lucene最核心的特征是通过特殊的索引结构实现了传统数据库不擅长的全文索引机制,并提供了扩展接口,以方便针对不同应用的定制。


可以通过一下表格对比一下数据库的模糊查询:































  Lucene全文索引引擎 数据库
索引 将数据源中的数据都通过全文索引一一建立反向索引 对于LIKE查询来说,数据传统的索引是根本用不上的。数据需要逐个便利记录进行GREP式的模糊匹配,比有索引的搜索速度要有多个数量级的下降。
匹配效果 通过词元(term)进行匹配,通过语言分析接口的实现,可以实现对中文等非英语的支持。 使用:like “%net%” 会把netherlands也匹配出来,
多个关键词的模糊匹配:使用like “%com%net%”:就不能匹配词序颠倒的xxx.net..xxx.com
匹配度 有匹配度算法,将匹配程度(相似度)比较高的结果排在前面。 没有匹配程度的控制:比如有记录中net出现5词和出现1次的,结果是一样的。
结果输出 通过特别的算法,将最匹配度最高的头100条结果输出,结果集是缓冲式的小批量读取的。 返回所有的结果集,在匹配条目非常多的时候(比如上万条)需要大量的内存存放这些临时结果集。
可定制性 通过不同的语言分析接口实现,可以方便的定制出符合应用需要的索引规则(包括对中文的支持) 没有接口或接口复杂,无法定制
结论 高负载的模糊查询应用,需要负责的模糊查询的规则,索引的资料量比较大 使用率低,模糊匹配规则简单或者需要模糊查询的资料量少

全文检索和数据库应用最大的不同在于:让最相关的头100条结果满足98%以上用户的需求

Lucene的创新之处:


大部分的搜索(数据库)引擎都是用B树结构来维护索引,索引的更新会导致大量的IO操作,Lucene在实现中,对此稍微有所改进:不是维护一个索引文件,而是在扩展索引的时候不断创建新的索引文件,然后定期的把这些新的小索引文件合并到原先的大索引中(针对不同的更新策略,批次的大小可以调整),这样在不影响检索的效率的前提下,提高了索引的效率。


Lucene和其他一些全文检索系统/应用的比较:































  Lucene 其他开源全文检索系统
增量索引和批量索引 可以进行增量的索引(Append),可以对于大量数据进行批量索引,并且接口设计用于优化批量索引和小批量的增量索引。 很多系统只支持批量的索引,有时数据源有一点增加也需要重建索引。
数据源 Lucene没有定义具体的数据源,而是一个文档的结构,因此可以非常灵活的适应各种应用(只要前端有合适的转换器把数据源转换成相应结构), 很多系统只针对网页,缺乏其他格式文档的灵活性。
索引内容抓取 Lucene的文档是由多个字段组成的,甚至可以控制那些字段需要进行索引,那些字段不需要索引,近一步索引的字段也分为需要分词和不需要分词的类型:
   需要进行分词的索引,比如:标题,文章内容字段
   不需要进行分词的索引,比如:作者/日期字段
缺乏通用性,往往将文档整个索引了
语言分析 通过语言分析器的不同扩展实现:
可以过滤掉不需要的词:an the of 等,
西文语法分析:将jumps jumped jumper都归结成jump进行索引/检索
非英文支持:对亚洲语言,阿拉伯语言的索引支持
缺乏通用接口实现
查询分析 通过查询分析接口的实现,可以定制自己的查询语法规则:
比如: 多个关键词之间的 + – and or关系等
 
并发访问 能够支持多用户的使用  

 


关于亚洲语言的的切分词问题(Word Segment)


对于中文来说,全文索引首先还要解决一个语言分析的问题,对于英文来说,语句中单词之间是天然通过空格分开的,但亚洲语言的中日韩文语句中的字是一个字挨一个,所有,首先要把语句中按“词”进行索引的话,这个词如何切分出来就是一个很大的问题。


首先,肯定不能用单个字符作(si-gram)为索引单元,否则查“上海”时,不能让含有“海上”也匹配。


但一句话:“北京天安门”,计算机如何按照中文的语言习惯进行切分呢?
“北京 天安门” 还是“北 京 天安门”?让计算机能够按照语言习惯进行切分,往往需要机器有一个比较丰富的词库才能够比较准确的识别出语句中的单词。


另外一个解决的办法是采用自动切分算法:将单词按照2元语法(bigram)方式切分出来,比如:
“北京天安门” ==> “北京 京天 天安 安门”。


这样,在查询的时候,无论是查询”北京” 还是查询”天安门”,将查询词组按同样的规则进行切分:”北京”,”天安安门”,多个关键词之间按与”and”的关系组合,同样能够正确地映射到相应的索引中。这种方式对于其他亚洲语言:韩文,日文都是通用的。


基于自动切分的最大优点是没有词表维护成本,实现简单,缺点是索引效率低,但对于中小型应用来说,基于2元语法的切分还是够用的。基于2元切分后的索引一般大小和源文件差不多,而对于英文,索引文件一般只有原文件的30%-40%不同,




























自动切分 词表切分
实现 实现非常简单 实现复杂
查询 增加了查询分析的复杂程度, 适于实现比较复杂的查询语法规则
存储效率 索引冗余大,索引几乎和原文一样大 索引效率高,为原文大小的30%左右
维护成本 无词表维护成本 词表维护成本非常高:中日韩等语言需要分别维护。
还需要包括词频统计等内容
适用领域 嵌入式系统:运行环境资源有限
分布式系统:无词表同步问题
多语言环境:无词表维护成本
对查询和存储效率要求高的专业搜索引擎

目前比较大的搜索引擎的语言分析算法一般是基于以上2个机制的结合。关于中文的语言分析算法,大家可以在Google查关键词”wordsegment search”能找到更多相关的资料。


安装和使用


下载:http://jakarta.apache.org/lucene/


注意:Lucene中的一些比较复杂的词法分析是用JavaCC生成的(JavaCC:JavaCompilerCompiler,纯Java的词法分析生成器),所以如果从源代码编译或需要修改其中的QueryParser、定制自己的词法分析器,还需要从https://javacc.dev.java.net/下载javacc。


lucene的组成结构:对于外部应用来说索引模块(index)和检索模块(search)是主要的外部应用入口
























org.apache.Lucene.search/ 搜索入口
org.apache.Lucene.index/ 索引入口
org.apache.Lucene.analysis/ 语言分析器
org.apache.Lucene.queryParser/ 查询分析器
org.apache.Lucene.document/ 存储结构
org.apache.Lucene.store/  底层IO/存储结构
org.apache.Lucene.util/ 一些公用的数据结构

简单的例子演示一下Lucene的使用方法:

索引过程:从命令行读取文件名(多个),将文件分路径(path字段)和内容(body字段)2个字段进行存储,并对内容进行全文索引:索引的单位是Document对象,每个Document对象包含多个字段Field对象,针对不同的字段属性和数据输出的需求,对字段还可以选择不同的索引/存储字段规则,列表如下:





































方法 切词 索引 存储 用途
Field.Text(String name, String value) Yes Yes Yes 切分词索引并存储,比如:标题,内容字段
Field.Text(String name, Reader value) Yes Yes No 切分词索引不存储,比如:META信息,
不用于返回显示,但需要进行检索内容
Field.Keyword(String name, String value) No Yes Yes 不切分索引并存储,比如:日期字段
Field.UnIndexed(String name, String value) No No Yes 不索引,只存储,比如:文件路径
Field.UnStored(String name, String value) Yes Yes No 只全文索引,不存储
public class IndexFiles { 
//使用方法:: IndexFiles [索引输出目录] [索引的文件列表] …
public static void main(String[] args) throws Exception {
String indexPath = args[0];
IndexWriter writer;
//用指定的语言分析器构造一个新的写索引器(第3个参数表示是否为追加索引)
writer = new IndexWriter(indexPath, new SimpleAnalyzer(), false);

for (int i=1; i<ARGS.LENGTH; {
System.out.println(“Indexing file ” + args[i]);
InputStream is = new FileInputStream(args[i]);

//构造包含2个字段Field的Document对象
//一个是路径path字段,不索引,只存储
//一个是内容body字段,进行全文索引,并存储
Document doc = new Document();
doc.add(Field.UnIndexed(“path”, args[i]));
doc.add(Field.Text(“body”, (Reader) new InputStreamReader(is)));
//将文档写入索引
writer.addDocument(doc);
is.close();
};
//关闭写索引器
writer.close();
}
}
 

索引过程中可以看到:



  • 语言分析器提供了抽象的接口,因此语言分析(Analyser)是可以定制的,虽然lucene缺省提供了2个比较通用的分析器SimpleAnalyser和StandardAnalyser,这2个分析器缺省都不支持中文,所以要加入对中文语言的切分规则,需要修改这2个分析器。
  • Lucene并没有规定数据源的格式,而只提供了一个通用的结构(Document对象)来接受索引的输入,因此输入的数据源可以是:数据库,WORD文档,PDF文档,HTML文档……只要能够设计相应的解析转换器将数据源构造成成Docuement对象即可进行索引。
  • 对于大批量的数据索引,还可以通过调整IndexerWrite的文件合并频率属性(mergeFactor)来提高批量索引的效率。

检索过程和结果显示:


搜索结果返回的是Hits对象,可以通过它再访问Document==>Field中的内容。


假设根据body字段进行全文检索,可以将查询结果的path字段和相应查询的匹配度(score)打印出来,

public class Search { 
public static void main(String[] args) throws Exception {
String indexPath = args[0], queryString = args[1];
//指向索引目录的搜索器
Searcher searcher = new IndexSearcher(indexPath);
//查询解析器:使用和索引同样的语言分析器
Query query = QueryParser.parse(queryString, “body”,
new SimpleAnalyzer());
//搜索结果使用Hits存储
Hits hits = searcher.search(query);
//通过hits可以访问到相应字段的数据和查询的匹配度
for (int i=0; i<HITS.LENGTH(); {
System.out.println(hits.doc(i).get(“path”) + “; Score: ” +
hits.score(i));
};
}
}
在整个检索过程中,语言分析器,查询分析器,甚至搜索器(Searcher)都是提供了抽象的接口,可以根据需要进行定制。

Hacking Lucene


简化的查询分析器


个人感觉lucene成为JAKARTA项目后,画在了太多的时间用于调试日趋复杂QueryParser,而其中大部分是大多数用户并不很熟悉的,目前LUCENE支持的语法:


Query ::= ( Clause )*
Clause ::= ["+", "-"] [ ":"] ( | “(” Query “)”)


中间的逻辑包括:and or + – &&||等符号,而且还有”短语查询”和针对西文的前缀/模糊查询等,个人感觉对于一般应用来说,这些功能有一些华而不实,其实能够实现目前类似于Google的查询语句分析功能其实对于大多数用户来说已经够了。所以,Lucene早期版本的QueryParser仍是比较好的选择。


添加修改删除指定记录(Document)


Lucene提供了索引的扩展机制,因此索引的动态扩展应该是没有问题的,而指定记录的修改也似乎只能通过记录的删除,然后重新加入实现。如何删除指定的记录呢?删除的方法也很简单,只是需要在索引时根据数据源中的记录ID专门另建索引,然后利用IndexReader.delete(Termterm)方法通过这个记录ID删除相应的Document。


根据某个字段值的排序功能


lucene缺省是按照自己的相关度算法(score)进行结果排序的,但能够根据其他字段进行结果排序是一个在LUCENE的开发邮件列表中经常提到的问题,很多原先基于数据库应用都需要除了基于匹配度(score)以外的排序功能。而从全文检索的原理我们可以了解到,任何不基于索引的搜索过程效率都会导致效率非常的低,如果基于其他字段的排序需要在搜索过程中访问存储字段,速度回大大降低,因此非常是不可取的。


但这里也有一个折中的解决方法:在搜索过程中能够影响排序结果的只有索引中已经存储的docID和score这2个参数,所以,基于score以外的排序,其实可以通过将数据源预先排好序,然后根据docID进行排序来实现。这样就避免了在LUCENE搜索结果外对结果再次进行排序和在搜索过程中访问不在索引中的某个字段值。


这里需要修改的是IndexSearcher中的HitCollector过程:


 scorer.score(new HitCollector() {
private float minScore = 0.0f;
public final void collect(int doc, float score) {
if (score > 0.0f && // ignore zeroed buckets
(bits==null || bits.get(doc))) { // skip docs not in bits
totalHits[0]++;
if (score >= minScore) {
/* 原先:Lucene将docID和相应的匹配度score例入结果命中列表中:
* hq.put(new ScoreDoc(doc, score)); // update hit queue
* 如果用doc 或 1/doc 代替 score,就实现了根据docID顺排或逆排
* 假设数据源索引时已经按照某个字段排好了序,而结果根据docID排序也就实现了
* 针对某个字段的排序,甚至可以实现更复杂的score和docID的拟合。
*/
hq.put(new ScoreDoc(doc, (float) 1/doc ));
if (hq.size() > nDocs) { // if hit queue overfull
hq.pop(); // remove lowest in hit queue
minScore = ((ScoreDoc)hq.top()).score; // reset minScore
}
}
}
}
}, reader.maxDoc());

更通用的输入输出接口


虽然lucene没有定义一个确定的输入文档格式,但越来越多的人想到使用一个标准的中间格式作为Lucene的数据导入接口,然后其他数据,比如PDF只需要通过解析器转换成标准的中间格式就可以进行数据索引了。这个中间格式主要以XML为主,类似实现已经不下4,5个:

数据源: WORD       PDF     HTML    DB       other
\ | | | /
XML中间格式
|
Lucene INDEX

目前还没有针对MSWord文档的解析器,因为Word文档和基于ASCII的RTF文档不同,需要使用COM对象机制解析。这个是我在Google上查的相关资料:http://www.intrinsyc.com/products/enterprise_applications.asp
另外一个办法就是把Word文档转换成text:http://www.winfield.demon.nl/index.html



索引过程优化


索引一般分2种情况,一种是小批量的索引扩展,一种是大批量的索引重建。在索引过程中,并不是每次新的DOC加入进去索引都重新进行一次索引文件的写入操作(文件I/O是一件非常消耗资源的事情)。


Lucene先在内存中进行索引操作,并根据一定的批量进行文件的写入。这个批次的间隔越大,文件的写入次数越少,但占用内存会很多。反之占用内存少,但文件IO操作频繁,索引速度会很慢。在IndexWriter中有一个MERGE_FACTOR参数可以帮助你在构造索引器后根据应用环境的情况充分利用内存减少文件的操作。根据我的使用经验:缺省Indexer是每20条记录索引后写入一次,每将MERGE_FACTOR增加50倍,索引速度可以提高1倍左右。


搜索过程优化


lucene支持内存索引:这样的搜索比基于文件的I/O有数量级的速度提升。
http://www.onjava.com/lpt/a/3273
而尽可能减少IndexSearcher的创建和对搜索结果的前台的缓存也是必要的。



Lucene面向全文检索的优化在于首次索引检索后,并不把所有的记录(Document)具体内容读取出来,而起只将所有结果中匹配度最高的头100条结果(TopDocs)的ID放到结果集缓存中并返回,这里可以比较一下数据库检索:如果是一个10,000条的数据库检索结果集,数据库是一定要把所有记录内容都取得以后再开始返回给应用结果集的。所以即使检索匹配总数很多,Lucene的结果集占用的内存空间也不会很多。对于一般的模糊检索应用是用不到这么多的结果的,头100条已经可以满足90%以上的检索需求。


如果首批缓存结果数用完后还要读取更后面的结果时Searcher会再次检索并生成一个上次的搜索缓存数大1倍的缓存,并再重新向后抓取。所以如果构造一个Searcher去查1-120条结果,Searcher其实是进行了2次搜索过程:头100条取完后,缓存结果用完,Searcher重新检索再构造一个200条的结果缓存,依此类推,400条缓存,800条缓存。由于每次Searcher对象消失后,这些缓存也访问那不到了,你有可能想将结果记录缓存下来,缓存数尽量保证在100以下以充分利用首次的结果缓存,不让Lucene浪费多次检索,而且可以分级进行结果缓存。


Lucene的另外一个特点是在收集结果的过程中将匹配度低的结果自动过滤掉了。这也是和数据库应用需要将搜索的结果全部返回不同之处。


我的一些尝试



  • 支持中文的Tokenizer:这里有2个版本,一个是通过JavaCC生成的,对CJK部分按一个字符一个TOKEN索引,另外一个是从SimpleTokenizer改写的,对英文支持数字和字母TOKEN,对中文按迭代索引。
  • 基于XML数据源的索引器:XMLIndexer,因此所有数据源只要能够按照DTD转换成指定的XML,就可以用XMLIndxer进行索引了。
  • 根据某个字段排序:按记录索引顺序排序结果的搜索器:IndexOrderSearcher,因此如果需要让搜索结果根据某个字段排序,可以让数据源先按某个字段排好序(比如:PriceField),这样索引后,然后在利用这个按记录的ID顺序检索的搜索器,结果就是相当于是那个字段排序的结果了。

从Lucene学到更多


Luene的确是一个面对对象设计的典范



  • 所有的问题都通过一个额外抽象层来方便以后的扩展和重用:你可以通过重新实现来达到自己的目的,而对其他模块而不需要;
  • 简单的应用入口Searcher, Indexer,并调用底层一系列组件协同的完成搜索任务;
  • 所有的对象的任务都非常专一:比如搜索过程:QueryParser分析将查询语句转换成一系列的精确查询的组合(Query),通过底层的索引读取结构IndexReader进行索引的读取,并用相应的打分器给搜索结果进行打分/排序等。所有的功能模块原子化程度非常高,因此可以通过重新实现而不需要修改其他模块。 
  • 除了灵活的应用接口设计,Lucene还提供了一些适合大多数应用的语言分析器实现(SimpleAnalyser,StandardAnalyser),这也是新用户能够很快上手的重要原因之一。

这些优点都是非常值得在以后的开发中学习借鉴的。作为一个通用工具包,Lunece的确给予了需要将全文检索功能嵌入到应用中的开发者很多的便利。


此外,通过对Lucene的学习和使用,我也更深刻地理解了为什么很多数据库优化设计中要求,比如:



  • 尽可能对字段进行索引来提高查询速度,但过多的索引会对数据库表的更新操作变慢,而对结果过多的排序条件,实际上往往也是性能的杀手之一。
  • 很多商业数据库对大批量的数据插入操作会提供一些优化参数,这个作用和索引器的merge_factor的作用是类似的,
  • 20%/80%原则:查的结果多并不等于质量好,尤其对于返回结果集很大,如何优化这头几十条结果的质量往往才是最重要的。
  • 尽可能让应用从数据库中获得比较小的结果集,因为即使对于大型数据库,对结果集的随机访问也是一个非常消耗资源的操作。

参考资料:


Apache: Lucene Project
http://jakarta.apache.org/lucene/
Lucene开发/用户邮件列表归档
Lucene-dev@jakarta.apache.org
Lucene-user@jakarta.apache.org


The Lucene search engine: Powerful, flexible, and free
http://www.javaworld.com/javaworld/jw-09-2000/jw-0915-Lucene_p.html


Lucene Tutorial
http://www.darksleep.com/puff/lucene/lucene.html


Notes on distributed searching with Lucene
http://home.clara.net/markharwood/lucene/


中文语言的切分词
http://www.google.com/search?sourceid=navclient&hl=zh-CN&q=chinese+word+segment


搜索引擎工具介绍
http://searchtools.com/


Lucene作者Cutting的几篇论文和专利
http://lucene.sourceforge.net/publications.html 


Lucene的.NET实现:dotLucene
http://sourceforge.net/projects/dotlucene/


Lucene作者Cutting的另外一个项目:基于Java的搜索引擎Nutch
http://www.nutch.org/   http://sourceforge.net/projects/nutch/


关于基于词表和N-Gram的切分词比较
http://china.nikkeibp.co.jp/cgi-bin/china/news/int/int200302100112.html

2005-01-08 Cutting在Pisa大学做的关于Lucene的讲座:非常详细的Lucene架构解说


特别感谢:
前网易CTO许良杰(Jack Xu)给我的指导:是您将我带入了搜索引擎这个行业。

原文出处:http://www.chedong.com/tech/lucene.html

 
 

【业界新闻】pcsoft 的回复

18

pcsoft 9# 回贴:(呵呵,现已被删,还好之前在我这里做了备份)


一楼的请问你的是哪个软件?最近为什么都是新ID骂我们呢?

你说的问题我一个一个给你回答:

——————————————————————-
“只有试过才知道什么叫不成熟,什么叫不专业,什么叫只钱不识货,本来小的修改,只是改个简介还要与客服直接联系,我晕,别自已给自己找借口,弄好再上市不行吧,跟什么风呀(代理风),做出自已的特色不行吗?”

我们锁死的不是软件简介,是注册说明,请问你的软件每次都需要改注册码发放方式吗?如果是这样,你还是别开发软件了,软件简介我们是即时改的,好好看清楚!
——————————————————————-
“我现在后悔将软件放上面去,而且让你停售都不行,没这个功能。“

你不会联系客户经理吗?你发布上来,我们通过审核,要停售也应该打个招呼吧,玩我们?
——————————————————————-
”反馈回复慢不说“

我刚才查过了,我们的反馈大部分都是24小时内回复的,周末的是48小时内回复,你觉得应该多快呢?和网路之类的比够快了吧?
——————————————————————-
”连发布个软件4天了不能正常销售“

如果发布的软件太烂或明显有恶意价格竞争等问题,我们是不通过省核的
我们作者管理区里登录默认的页面就显示:您现在发布了多少产品,有多少正在销售

不过我们采纳您的意见,很快会新增,”此软件未通过省核“这个状态

——————————————————————-
我们是商城,不是网路,他们是替您收钱的,我们是替您推广的,您如果要停售,我们需要把各各推荐位置上的广告都拿下来,请问我们这边安排工作有错吗?

我们是华军软件园的子公司,不是私人承包,以前已经说过了,请看之前的贴子。


摘自:http://www.cnsw.org/bbs/viewthread.php?tid=7852&page=1&sid=f6EFuv

 
 

【文摘】《周杰伦》(转)

13

长像有猫腻样
唱歌有结巴像
自以为是—很靓
KAO,小样


从一开始的众多”新人”之一,到现在的”华语乐坛”领头人;
从害羞的男孩,到现在的最”屌”巨星;
从吴宗宪口中的”华人第一才子”,到刘德华的”当红”评价;
从sbdw的幕后黑手,到蔡依林的变身功臣;
从12届金曲奖的得奖冷门,到14届金曲奖杠龟冷门;
从许如云专辑文案中的”新锐制作人”,到莫文蔚专辑”天王制作人”……
周杰伦完成这一切用了4年时间。


4年中的每一步都可以被记录在案并为日后唱片公司培养新人作参考。


如今一提到周杰伦就会想到r&b就会想到”双节棍”和”同一种调调”
可是我今天想说的不是唱红r&b的周杰伦,也不是”哼哼哈嘿”的周杰伦
我要说的是作为制作人,词曲作者的周杰伦。
因为它的歌太红了,太个性了,所以很多人不得不认识他,欣赏他,
可是在众多”关爱”的背后是他的才华被忽略的”寂寞”。


jay曾说过他踏入歌坛的第一个梦想是所有他欣赏的歌手都唱过他写的歌。
一个典型的年轻创作人的心态。


那个时候他给许茹芸写的《禁止悲伤》乐评人说:”周杰伦虽然是新人,在创作上却相当能够掌握许茹芸的唱功表现, 他找到许茹芸音质中最醇美的一部份。
不用飙高音却自有一份撼动人心的感受。”


动力火车唱《重伤的泪水》时回想往日情景还曾流下男人泪。


还有闽南语歌后江惠也曾用jay写的《落雨声》感动六七十年代出生的歌迷们。很难把这些歌和他的调调联想到一起。


那个时候他还写过王力宏的《打开爱》,古巨基的《夜空的精灵》 ,和温岚的《眼泪知道》。
这些也证明了他的”我是写腻了流行歌才写r&b”的说法。


听过jay演唱会版的《蜗牛》,《你比从前快乐》还有《世界末日》,很难想象当年这些歌被其他歌手演唱的情况。


让我们回到过去:
《蜗牛》被许茹芸,齐秦,熊天平等人唱得荡气回肠,完全不像jay演唱时的少年情怀。
《你比从前快乐》是吴宗宪《你比从前快乐》专辑的主打歌。我在宗宪版听到的是一个男人的无奈和欲哭无泪,虽然老吴的声线永远没有突破,但是这首歌由这样一个有传奇有故事的男人演绎起来非常感人。同样的《平衡点》,和《三暝三日》也很有效果。
《屋顶》算是让全世界都认识了作为词曲作者的周杰伦,但是,这首ktv”国歌”实在是有够”俗”的。
sbdw版的《世界末日》没有jay版那么多感情投入,但是咻吡嘟哗版的和声可以称为”天籁”。
有很多人在听了jay演唱会上的《世界末日》后说这首歌当年就应该他自己唱嘛
可是在听了sbdw的版本后说这么一首好歌,这么优美的和声当年我怎么错过了?


当然,和jay合作最成功的应该是陈小春。《抱一抱》成功地把陈小春从”痞子”转型到”深情”男子。而且不会突兀,也没有适应不良。《我爱的人》几乎可以打动所有对”哼哼哈嘿”不屑一顾的人。到了《算你狠》,陈小春也可以有资格玩自己喜欢的hiphop和r&b了,不论和陶喆陈焕仁的合作多么”电光石火”,《一定要幸福》和《献世》仍然是深情款款挽留着歌迷的耳朵。


与其说莫文蔚把《黑雨》唱得没有一丝杰伦味,不如说成杰伦把《黑雨》写得很莫文蔚。
早就听说jay帮karen 写了一首歌,但是听《x》的感觉是很多歌都很杰伦味,但是都不”地道”
当看到歌词本的时候下了一跳。《爱死你是》柯有伦写的,《忽然东风》是陶喆写的,最不jay的《黑雨》居然是jay的。有人说,《黑雨》虽然没有写成很”俗”的r&b,但是也没有创意。
我想说的是,这首歌从一开始就不定位在”主打”的位置,它要完成的任务是让人听到莫文蔚的独特演唱方式和抒情歌曲的动人,它做到了,就成功了。


最不好评价的,最说不清楚地应该是jay和蔡依林的合作。
什么东西一扯上感情就变得很微妙。
同样是很典型杰伦式的歌曲,《刀马旦》被李文一唱就叫成功合作,《算命》被张学友唱就叫驾轻就熟。《骑士精神》被jolin一唱就叫做”女版周杰伦”"失败尝试”和”跟风”"流俗”……
我看来《骑士精神》被骂原因一是jolin在当时还没有确立自己声线的风格。所以你听她的歌基本上是听曲调而不是听声音。
jay曾把自己比作服装设计师,他说一件衣服做出来一定会有设计师的风格在里面,但是如果模特穿出自己的风格那才算成功。二是歌曲本身成了绯闻的炒作让听众从一开始就有了偏见。如果放下所有的背景,忘记周杰伦还是一个成功的歌手,那么这首歌还是有不错的创意的。至少在当时,可以把印度曲风和rap结合是不错的尝试,里面的和声也很有层次。
所以到了《说爱你》和《布拉格广场》,jay和jolin都很低调,虽然做出来的东西还是很jay,但是既然有《骑士精神》做前提,大家还是很喜欢也很接受了。人们开始讨论《布拉格广场》的东欧风情如何的赞,却忘记了《骑士精神》的印度游是多么的”失败”。


写到这里我想到的是世上本无路的话。
当年《范特西》刚刚出炉的时候,乐评人说这么一张没有市场定位,没有整体概念,没有确定听众范围的专辑即使每首歌都很好听但是从商业运作上就是失败的,”哼哼哈嘿”是永远不可能成为欣赏主流的。
但是到了《叶惠美》专辑,同一批乐评人,却说出了自打嘴巴的话:
专辑的市场定位是现在最流行的”周杰伦”风格,整体概念是”周杰伦”式的音乐形式,听众是”周杰伦”的一贯歌迷。虽然是”同一种调调”可是却是流行音乐的主流。
过分商业,过分流行,过分”周杰伦”,都成了乐评人”担忧”的主题。
呵呵这么大的转变是不是鲁迅口中的”走的人多了便也成了路”?



从另类,到主流;从听周杰伦的歌是”个性”,到听周杰伦的歌是”太俗”。
“周杰伦”这个名字是尴尬的。


然后就有很多所谓爱护jay的人给他提出各种意见。
什么”放稳脚步,多多吸收知识,避免江郎才尽”
什么”转作幕后,多和其它音乐人合作,避免主观‘周杰伦’”
什么”尝试不同曲风,避免昙花一现”


我想说的是jay释放灵感的速度是很少有人能比得上,因为他是在”玩”音乐。


有个人问”杰伦,《同一种调调》里有一句歌词我听不清楚,而且歌词本上也没有写,可以告诉我你唱的是什么吗?”
jay说那句是”副歌变绕口令”,是即兴加上去的,提醒副歌部分要结束了,现在到rap了。
这句没人听懂的歌词在百事可乐的广告里出现,我想很多人都一头雾水吧。充分印证姚明
“别把歌词唱清楚”的”忠告”。
还有《你听得到》在2分10秒的时候有一句歌词是倒着念的,《双刀》里加入了快打旋风游戏中
春丽的声音。这些都是他和歌迷玩的找茬游戏。
《娘子》里的rap是即兴加上去的,害得方文山不想去领”最佳作词人”奖。
《印第安老斑鸠》里,他彻底的玩弄他的声音。所以你听到所有类似”人类”的声音都是他自己的
“呦吼”"笑屁呀”"啊噜”"休息一下”。
《完美主义》中被人津津乐道的”周杰伦周杰伦周杰伦”和《反方向的钟》里的”b p m f d t n l”
《威廉古堡》里杀出来的《斗牛》的rap,不知道因为这首歌又一次拿到金曲奖最佳作词人的方文山该哭还是该笑。
在上吴宗宪的综艺节目时被要求唱陶喆的歌,他就说想到了一首但是不记得歌词了。于是就用”吴宗宪”
做歌词唱了一段《小镇姑娘》。还有一次被吴要求即兴为他写的词添曲。
结果”我妈美得像朵花,我弟肚脐眼比我大”这样的词居然被配上不错的旋律。
吴宗宪还有感而发地说”我好像是在玩电动玩具”。
以上这些都是他的即兴表演。
他只要不勉强,”玩”得开心,干吗替他着急什么”江郎才尽”?
他曾经说过曲调的雷同是他故意的,他不是写不出来别的调调。
因为有很多细节让人一听就是”周杰伦”,他认为这样比较”吊”。


说到合作的问题,他是个很主观的人,很多人都说他很”拽”。
用jay的话说,所谓的合作不是和别人和写一首歌,这样一首歌里有两个性格。他想的合作是重新演绎别人的歌,也欢迎别人重新演绎他的歌。也可以给别人写曲其他人制作。这些都是合作,而且它一直在和别人”合作”。这点就体现在他在”theone”演唱会上重新演绎陶喆的”找自己”,从编曲到演唱风格都作了改变。当他唱”这么多人到哪里去”的时候还不忘酷酷的加上一句”去看周杰伦演唱会”。有一天在一段娱乐新闻中听到了一小段陶喆唱《爱在西元前》,差点笑死。也证实了jay的”怪歌”换个人唱就成了”搞笑版”不信你可以听听山东版的《双节棍》和上海话版的《东风破》。


他曾用了艺名和有违”杰伦风格”的音乐形式,出现在新人的专辑当中,
他好像还很高兴别人没有听出来是他写的歌。他说”有人问我我就承认,没人问我我永远不承认那是我写的。”
当然,后果是那个新人的专辑不被重视的淹没在众多唱片当中,默默无闻。
所以jay说”现在的音乐形式是最好的”。



jay现在的理想是在华语乐坛留下一个时代的印记。只有有独特并且一惯的风格才能做到。
我喜欢brian mcknight的蓝调音乐,但是他就是很多年不曾改变,听他的歌永远都是腻人的蓝色
有天我腻了,跑去听小甜甜了。但是有天我回首伴我度过年轻岁月的音乐时,
我会永远怀念brian曾经带来的感动的。我想jay也是想做那个永远在那里,不会变的”感动”吧。
现在的国语流行音乐市场很”变态”,歌迷们也变得很”变态”。
他门联合起来要求歌手不断求新,却因此要放弃原本很好的东西。
所以当我们听到陶喆的《黑色柳丁》是却怀念着《沙滩》;
当我们听张学友的《热》却怀念着《吻别》
当我们听到刘德华唱《黑蝙蝠中队》时大叫的是”把我的《冰雨》还给我!!”
王立宏的麦当劳主题曲,让我们感觉到了制作人的辛苦与无奈。


所以我们更应该因为jay能自己主导自己的风格,自己做自己的音乐而感到庆幸。
他可以不用在别人的”指挥”下,作出一桌好菜,那么,我们是不是应该放下所有偏见
来品尝他?然后我们选择”爱吃”或者”不爱吃”。有天你吃腻了,不再来这家餐厅了。
但是,他永远都在那里,提醒你,你曾经为他着迷,为他感动。
这个世界太多变数,我们应该因为有一块”不变”的美丽而更加珍惜!



?周杰伦的歌有一个非常奇特的地方,就是曲子和歌词的行进速度不匹配!就是说,歌词的一句唱完了,曲子却没告一个段落,于是接着唱下一句词,上句和下句中完全听不出分界线;或者是曲子的一个小节唱完了,没完的词放在下一小节。在一句中也是如此,歌词的句读和曲子的急缓常常拧着。加上他天生的吐字不清,所以他的歌不看着歌词很难听懂。吐字发音是他一贯被人所诟病的地方,且先不论。这种词曲的速度差,却形成了一种非常奇妙的韵律感。时而”间关莺语花底滑”,时而”幽咽泉流冰下难”;有种”峰回路转”,”柳暗花明”的曲折,还有点”蓦然回首”和”豁然开朗”的快感。这样形容不大好,不过我确实在听他的歌中时时想起诗词。古时候,诗是要放声诵读的,词更是要唱的,格律极其重要。即便今日,用普通话朗诵诗词时,我们还能从平仄和韵脚中,体会到汉语的旋律感。又联想到电影,电影的节奏感是非常重要的,好的节奏能把观众的心死死扣住,坏了就让人昏昏欲睡,周杰伦的节奏就有这种直扣人心的本事。有说法讲郑秀文是节奏感最强的华人女演员,那周杰伦至少算得上节奏感最奇妙的华人男歌手了。


  要体味这种奇妙的节奏感,《爱在西元前》、《开不了口》、《以父之名》等都是典范。用诗词或电影来比拟,只是理性上的分析,若从感性上讲,有点仿佛”翻滚过山车”,一下子慢慢爬升,一下子飞驰直下,超重和失重的交迭更替。听一听《娘子》,就有这种既迂回又淋漓的快感。


  在《东风破》里,奇异的却不是词曲的速度差,而是字的发音和曲调的配合了。一个从来不听周杰伦的朋友,一日听到”酒暖回忆思念瘦”和”水向东流时间怎么偷”这两句时,都忍不住感慨:这”偷”字和”瘦”字难为他怎么想来!这种用字的发音去切合旋律,几乎近于唐诗的”炼字”了。尤其是”谁在用琵琶弹奏一曲东风破”一句,唇音连绵词”琵琶”再加上舌音”弹”和齿音”奏”,四个字正好碰上曲子的那么一轻抛,再跟上最后的一个唇音”破”,嘿嘿。


  说罢了曲,来说说词,《爱在西元前》让我见识到原来歌词是可以这样写的,《娘子》和《东风破》的古典情怀,《你听得到》和《半岛铁盒》的都市恋曲,《三年二班》和《对不起》的青春纪念,《米兰的小铁匠》和《伊斯坦堡》的异国情调,《双截棍》和《龙拳》的尚武精神,《以父之名》学教父的意境,《最后的战役》仿佛战争电影,《梯田》讲环保,《半兽人》讲电玩游戏,《爸我回来了》讲家庭暴力,《双刀》讲海外华人受到的压迫,《威廉古堡》讲吸血鬼……周杰伦的歌词,涵盖的范围相当广,比起只在城市的风花雪月中徘徊的大多数歌手来讲,高了好几个层次。周杰伦的黄金拍档,鬼才方文山,确实是才气迫人,词句在他手中被肆意分割、打散、重组,如果说周杰伦是拿音符当玩具,方文山就是拿文字当拼图了。看惯了顺流直下的歌词,乍一见他那种东一鳞、西一爪,片光只羽的风格,真是石破天惊的感觉。还拿电影做比较,大部分歌词都是长镜头,方文山的歌词却是蒙太奇中的蒙太奇。若不是有林夕珠玉在前,他能引起更大的惊叹。而我个人看法,方文山胜在手脚舒展,不象林夕,玩文字玩的有些小家子气了。


  许多好歌手,或把歌曲作为一种表达手段,或把歌曲作为一件艺术品来经营,而象周杰伦和方文山这样,把歌曲作为玩具来摆弄,挥洒自如游刃有余的,还真不多见。也许音乐,真的是需要各种不同的表现方式。


长像有猫腻样,
唱歌有结巴像,
自以为是—很靓,
KAO,小样!


转自:http://zhufeifeizhu.blogchina.com/685736.html

 
 

【文摘】蚊

08

蚊类常骚扰人畜、刺吸血液,并能传播多种疾病,被列为“四害”之一。蚊虫的种类繁多,全世界已知的有2000余种,我国已发现300余种。蚊类属昆虫纲、双翅目、蚊科,其中与人类关系最密切的主要有按蚊、库蚊和伊蚊三个属,家居环境常见的有10余种。


蚊类的形态、生活史与生态习性


(1)形态特征


通常看到的能飞的蚊子,实际上是蚊类的成虫形态。它的体长因种而异,约5~15毫米。它体细足长,体表覆盖鳞片。蚊类与其它昆虫一样,整体可分头、胸、腹三部分。胸部三节各有一对足,中胸背部有一对翅,后胸背部的翅退化为一对平衡棒。


成蚊的头部为球形,两侧有一对复眼,两眼之间有一对触角,触角的头上有轮毛。雌蚊轮毛疏而短,雄蚊的密而长,易于区别。它头的前下部有一长喙,是蚊的刺吸式口器用于吸血。雄蚊的口器退化,因而不能吸血,只吸植物汁液。由此可见,叮咬人的蚊子是雌蚊而不是雄蚊。


雌蚊产的卵很小,长约1毫米,形状因种而异。它们必须在水中孵化为幼虫。刚产出的卵为灰白色,但很快就变成黑色或棕色,常浮于水面或沉于水底。幼虫俗称孑孓,身长而扁,头胸腹三部分界清楚,每蜕皮一次就长大一些,最后变为蛹。蚊蛹是能活动的围蛹,外形像逗点,分头胸和腹两部,前者膨大,后者狭长。蛹期很短,温度适宜时,经1~2日就羽化为成蚊。


(2)生活史


蚊虫的一生分为4个时期,卵、幼虫、蛹、成虫,被称为完全变态。卵是胚胎时期,幼虫和蛹是生长时期,成虫是繁殖时期。前3个时期必须生活在水中,成蚊则生活于陆地,产卵于水中。卵在水中孵化为幼虫,幼虫经4次蜕皮变为蛹,蛹羽化为成蚊。在适宜的温度和环境条件下,完成一个周期通常需要15天左右。卵期1~2天,幼虫期5~7天,蛹期2~3天,成蚊羽化至吸血1~2天,吸血至产卵2~5天。


(3)生态习性


① 吸血


雌蚊吸血是为了繁殖的需要,只有吸血才能产卵。成蚊羽化24小时后就能群舞交配、吸血。高温高湿和微光可促进蚊虫吸血活动。雌蚊随着胃血的消化,卵巢逐渐发育,成熟后即开始产卵,随后再吸血,依此循环。各蚊种的嗜血习性不同,有的嗜人血,如白纹伊蚊;有的则嗜吸动物血,如中华蚊、三带喙库蚊;有的则兼吸人血和动物血,如淡色库蚊。大多数蚊种均习惯于夜间进行叮刺吸血,少数蚊种如白纹伊蚊多在白天吸血。


② 交配


夏天的傍晚和黎明时分,蚊类聚集在一起飞翔,便出现群舞的奇观。其实,这是蚊虫在“谈恋爱”,它们找到舞伴后即进行交配,一只雄蚊可与多只雌蚊交配,但只有少数雌蚊受孕。多数蚊种的雌蚊一生只交配一次,但有的蚊如白纹伊蚊一生可交配数次。


③ 栖息


不同蚊种栖息的环境不同。家栖蚊种如淡色库蚊吸血后,白天多栖息在人房、畜舍的隐蔽处。半家栖蚊种如中华按蚊、三带喙库蚊等,兼有室内外栖息的习性,吸血后部分留在人房或畜舍内,部分飞往野外。野栖蚊种如白纹伊蚊吸血后则栖息活动于野外。蚊虫多在光线较暗的早晚或夜间活动,而伊蚊白天亦可活动、吸血。成蚊的飞行距离一般为1~2公里,但很少远飞迁徙。


④ 产卵


各种蚊虫的产卵习性不同,一只雌蚊一生可产卵好几批,中华按蚊每批产卵约200个,淡色库蚊每批200个左右,伊蚊每批产卵50~100个。初产的卵会因缺水而死亡。


⑤ 季节变化


在我国大多数季节分明的地区,蚊虫数量的变化较大,同时也与温度及雨量有密切关系。夏天的高温、高湿、多雨条件有利于蚊虫孳生繁殖,且密度很高。冬季气温低,蚊虫不能发育繁殖,而且大批死亡,其密度降到低限。


⑥ 越冬


在四季分明的地区,受自然环境因素的影响,蚊虫会出现繁殖期和越冬期交替的现象。冬季气温过低,蚊虫停止繁殖,成蚊都聚集到较温暖、微小气候比较稳定的场所隐蔽起来,不食不动,新东代谢降到最低水平,处于蛰伏状态,称为越冬。早春气温变暖时,存活的成蚊开始吸血、产卵,繁殖后代。蚊虫的越冬方式因种而异,如淡色库蚊多以成虫越冬,微小按蚊、三带喙库蚊多以幼虫越冬,白蚊伊蚊多以卵越冬。越冬时间,多数蚊虫自然死亡,只有极少数能存活到次年春天。越冬期是蚊虫数量最少、生命最脆弱的一个时期。


⑦ 寿命


蚊虫的春夏寿命一般为1~4周。影响蚊虫的寿命的因素是蚊种、气候、营养、个体活动、天敌状况等。晚秋羽化的雌蚊因越冬时间长短而异,如果产卵较少,营养充足,而气候环境适宜,寿命可达4~5个月之久。