Internet信息检索技术

上传人:平*** 文档编号:47565451 上传时间:2018-07-03 格式:PPT 页数:111 大小:503.14KB
返回 下载 相关 举报
Internet信息检索技术_第1页
第1页 / 共111页
Internet信息检索技术_第2页
第2页 / 共111页
Internet信息检索技术_第3页
第3页 / 共111页
Internet信息检索技术_第4页
第4页 / 共111页
Internet信息检索技术_第5页
第5页 / 共111页
点击查看更多>>
资源描述

《Internet信息检索技术》由会员分享,可在线阅读,更多相关《Internet信息检索技术(111页珍藏版)》请在金锄头文库上搜索。

1、InternetInternet信息检索技术信息检索技术吉林大学软件学院吉林大学软件学院一、本课程的内容开放信息(搜索引擎)泛搜索非开放信息(专有数据库)专门网站、权限管理二、本课程的意义 提高利用Internet的学习能力 扩大知识视野 浸润计算机思维 枯燥暂时无用感广阔的知识面三、关于考核 课件为主 最后1次测验 中间N次作业 独立查询、思考完成 关于纪律 四、现代信息与知识4.1 信息的概念春来秋去相思在,秋去春来信息稀唐朝鱼玄机闺怨梦断美人沉信息,目穿长路倚楼台 南唐李中暮春怀古人 欲传春信息,不怕雪埋藏南宋诗人陈亮梅花 香农定义用来消除随机不确定性的东西 哲学 本质、特征和运动规律的

2、反应四、现代信息与知识4.2 现代信息微电子技术计算机技术通信技 术软件技术 计算机技术和通信技术的融合数字通信越来越像计算机系统计算机网络已是彻底的数据通信 我校信息学部 (计算机软件通信电子)学院 特征 数字技术微处理技术 四、现代信息与知识4.3 信息定律摩尔定律微处理器处理能力18月翻番生物系统、量子芯片、蛋白芯片 贝尔定律处理能力不变前提下,芯片体积和 价格18月减半 吉尔德定律 带宽增长比CPU处理能力增长快3倍 梅特卡夫定律(3COM;ARPANET )网络价值和网络节点数量平方正比 四、现代信息与知识4.4 信息内容阶段数据 信息 知识价格数据 西北地区钢板价格下降幅度小 经济

3、发达地区受金融危机影响大四、现代信息与知识4.5 知识的概念信息的条理化和系统化产生了知识,人 类对于客观世界的认识和归纳 哲学分类感性知识 未经逻辑加工理性知识 国际分类 知是 飞碟知因 潮汐知如 写软件知谁 人才 四、现代信息与知识4.6 信息社会3C(通讯化、计算机、自动控制化)社会4A社会(工厂、办公室、家庭、农业自动化)1962年日本科学家提出 多媒体技术和信息高速公路技术的飞速发展成了可能 成了特征 信息应用渗透到各个领域 军事 和农业社会&工业社会的区别就是知识改变了 经济领域 波音飞机和袜子四、现代信息与知识 劳动力的结构发生了改变 国民经济中,信息化产值已经占到优势印度奇迹、

4、 华为公司的崛起 知识成为社会、发展的主要资源 微软 “经济建立在知识的生产、分配和使用上“是 主要特点4.7 知识经济四、现代信息与知识4.8 知识经济误区知识经济时代 设备、系统、人才 企业制度企业文化 信息化流程再造组织再造四、现代信息与知识4.9 信息革命工业一次革命 蒸汽机 畜力机械 工业二次革命 电的使用 能量传送 工业三次革命 信息革命改变人类自然能力最后区域,即思维(1)经济 韩国三星(2)行业 服务行业的发达 金融业的变化(3)企业 CAD CAM CRM(4)管理 集中 和 分布(5)文化 组织形态松散、上下扁平化、 知识结构的黑盒内外(6)政治 虚拟社会 网络力量 国家(

5、7)军事 武器 士兵 对抗 (杀人 毁工业 毁信息) 四、现代信息与知识4.10 信息革命发展国家的机会 一次英国崛起 二次美国独大 苏 联解体 遏制优先原则 我国的机会 工业化未完成 同学们的责任和机会 灾难:社会变化远远落后于技术的变化 管理机制 落后不是理由:印度的电影和软件 爱沙尼亚虎跃 计划美国独大 宽容失败 挑战勇气 学习意识欧洲惯性太大 过分依赖政府 否定市场 德国落后日本风险投入太小 美国依赖intel和微机险胜日本人类的想象是唯一的限制 规范化是我国的瓶颈 但是信息化不是社会发展的全部四、现代信息与知识4.11 信息领域问题内容:农业信息化电子商务电子政务 信息化企业各自为战

6、 管理不规范、恶意竞 争 企业:自己做买-外包 小农经济大鱼吃小鱼 个体的惯性意识、传统文化影响的消除几代信息从业者前赴后继的努力 向民航学习四、现代信息与知识 过去10年 成功项目25 失败项目25超出预算 不能运行 运行故障 关键 成熟技术经验最高决策的意志企业再造 三分技术七分管理4.12 信息化项目关键四、现代信息与知识 经济治理降低网络接入门槛;降低知识产权保护度政治治理 如何保护个人信息空间;网络犯罪 文化治理网络文化;不良信息社会治理网络实名制国家治理国界? 数据流向越境?4.13 数字世界治理四、现代信息与知识 信息资源优化生产力(三分钟) 信息资源投入促进其它资源的增值 信息

7、产品、信息服务本身直接创造财富高科技竞争人才竞争(专业技能信息素质)信息对社会的影响(秦始皇)(亚洲的汉语)4.14 信息财富?四、现代信息与知识 信息意识信息敏感性和自觉性(牛顿苹果,我的QQ)信息能力快速敏捷的掌握能力(唐骏说专业不重要)交流能力(别人知道你行的途径)个人知识个人拥有的基本知识方法论4.15 信息素质四、现代信息与知识 经济结构和就业结构发生了重大的变化服务业需求高于物质生产部门;脑力劳动者数量激增;15年来 8000工种消失 产生5000工种 跨行业发展的思想准备 不断学习是生存的本领与手段4.16 数字化生存四、现代信息与知识 共享性相对载体独立;不要太保守 非有限、稀

8、缺性取之不尽 驾驭性 可以决定物质能量(网络攻击) 对象的选择性 (金戒指 VS 笔记本) 财富(农业货币货币信息资源)4.17 信息资源的特点四、现代信息与知识 信息总量剧增与个人学习能力有限的矛盾2003.7数据:97万mail/分钟;Web数据53天翻一番;信息时空的空间时间化、时间精神化;信息量的剧增与信息质量无保证的矛盾 学会如何学习(利用Internet)4.18 信息资源与学习的矛盾四、现代信息与知识4.19 互联网使用情况中小学 生大学生办公室 职员农村外 出务工 人员总体网络媒体网络新闻68.1%89.9%83.1%73.4%78.5% 信息检索搜索引擎63.5%84.4%7

9、1.9%56.6%68.0% 网络招聘8.9%29.5%23.0%23.7%18.6% 网络通讯电子邮件52.2%81.4%60.4%38.9%56.8% 即时通信77.5%91.1%75.0%66.5%75.3% 网络社区拥有博客64.0%81.4%50.9%43.1%54.3% 论坛 /BBS24.1%55.5%34.6%17.2%30.7% 交友网站16.8%26.0%20.2%18.2%19.3% 网络娱乐网络音乐86.9%94.0%83.4%78.2%83.7% 网络视频67.4%84.4%68.1%57.3%67.7% 网络游戏69.7%64.2%60.6%55.5%62.8% 电

10、子商务网络购 物16.2%38.8%29.4%11.7%24.8% 网上卖东 西2.1%5.2%4.4%0.8%3.7% 网上支付9.6%30.5%22.4%7.9%17.6% 旅行预订2.0%6.8%6.8%2.5%5.6% 其他网上银行7.7%29.9%25.5%7.4%19.3% 网络炒股4.7%4.7%15.5%4.1%11.4% 网上教育16.2%25.6%17.3%7.8%16.5%五、信息查询基础 就是根据特定的需求、运用某种检索工具 、按照一定的方法查找所需信息的过程。 对应的过程是信息存储5.1信息检索的含义五、信息查询基础 按照检索对象划分(1)文献检索 找资料(学习C+)

11、(2)数据检索 确定某事情的数据(面试题)(3)事实检索 确定某件事情(中国的省份) 按照检索方式划分(1)手工检索 (2)计算机检索(单机检索-网络检索-智能检索)5.2信息检索的类型五、信息查询基础 就是根据特定的需求、运用某种检索工具、 按照一定的方法查找所需信息的过程。 信息整理排序查询关键词匹配结果检索工具负责传递关键词和进行匹配5.3信息检索原理五、信息查询基础 狭义上是指书刊资料;广义上指信息载体 四个要素:内容、物质载体、符号系统、记录方式文献内容:具有物质性、时效性、转换性、共享性、传递性 、可识别性、可伸缩性、模糊性等;载体:兽骨竹简纸-磁介质-半导体光介质符号系统:图画、

12、文字、编码、多媒体记录方式:写画、雕刻、印刷、摄制、录音(可转换)非文献信息源不作为讨论对象5.4信息源文献五、信息查询基础 纸质文献 微缩文献(数字水印) 磁盘和光盘5.5文献信息源类型(按照载体分类)五、信息查询基础 印刷型(空间大) 声像型(直观,专用设备) 电子型(数字和模拟) 网络型(CERNET)5.6文献信息源类型(按照记录方式分类)五、信息查询基础 零次文献(未公开于社会) 一次文献(原创、首次发表) 二次文献(检索性文献源) 三次文献(系统综合概括)如百科全书、年鉴、进展报告5.7 文献信息源类型(按照加工深度)五、信息查询基础 图书(50页以上的印刷品)ISBN(Inter

13、national Standard Book Number)国家出版者序列号校验码 期刊(连续出版物、新颖)ISSN(Series Standard)核心期刊(1:a:a2。)5.8 文献信息源类型(按照出版形式)五、信息查询基础 报纸(周期最短的连续出版物、不系统)网络新闻所替代 专利文献(法律、技术)发明专利、实用新型专利、外观设计专利 标准文献(ISO、IEEE)世界、国家、行业、地方、企业多级标准5.8 文献信息源类型(按照出版形式)五、信息查询基础 学位论文(学士、硕士、博士)本单位收藏外国家还指定单位收藏 科技报告(尖端学科的最新进展)绝密、机密、秘密、非密、解密报告 档案文献(国

14、家机构、社会组织)文书、人事、会计、科技、产品等 产品样本(产品目录、产品样本)5.9 文献信息源类型(按照出版形式)五、信息查询基础 白色文献公开或者内部出版的,正常渠道流通 灰色文献非正式渠道,如学位论文 黑色文献基本不能得到,如日记、信件5.10 文献信息源类型(按照公开程度和获取的难易程度)五、信息查询基础 实物信息源任何商品都是 口头信息源不具有记载性,信息质量不一,如电话5.11 非文献信息源五、信息查询基础 内容特征主题途径和分类途径 形式特征作者、机构、号码、引文5.12 信息检索途径(本质)五、信息查询基础 分类途径中国图书馆图书分类法(中图法)国家推荐,A-Z共26种分类(

15、T代表工业技术)中国科学院图书馆图书分类方法(科图法)人大法杜威十进制分类法、国际十进分类法、美国国会图书馆图书分类法(26类)5.13 信息的检索途径(文本)五、信息查询基础 主题词途径 规范化的词汇,专业性强专指性强,但查全率低 关键词途径 自然语词、专业性弱同义、近义、多义词容易造成误差,但可以 通过限制其它特征解决 摘要 全文(分词技术) 5.12 信息检索途径(盲搜索)五、信息查询基础 记录信息划分印刷型+数字型 信息完备性全文+二次 信息边界专门数据库+搜索引擎5.13 检索工具分类五、信息查询基础 多媒体检索依赖外部特征仍然是文本检索内部特征包括颜色、纹理、对象基于内容的多媒体检索目前仍然是难题5.14 信息检索面临的难题六、信息检索技术 布尔逻辑检索技术 截词检索技术 位置检索技术 全文检索技术 自然语言检索技术 多媒体检索技术6.1 组成六、信息检索技术 逻辑与 AND * 逻辑或 OR 逻辑非 NOT AB(含A但不含B)6.2

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号