第二章-信息论基本概念

上传人:资****亨 文档编号:133882391 上传时间:2020-05-31 格式:PPT 页数:64 大小:442KB
返回 下载 相关 举报
第二章-信息论基本概念_第1页
第1页 / 共64页
第二章-信息论基本概念_第2页
第2页 / 共64页
第二章-信息论基本概念_第3页
第3页 / 共64页
第二章-信息论基本概念_第4页
第4页 / 共64页
第二章-信息论基本概念_第5页
第5页 / 共64页
点击查看更多>>
资源描述

《第二章-信息论基本概念》由会员分享,可在线阅读,更多相关《第二章-信息论基本概念(64页珍藏版)》请在金锄头文库上搜索。

1、1 第二章信息论的基本概念 第一节信源的描述和分类 第二节离散信源的信息论概念 第三节离散信源的熵 2 第一节信源的描述和分类 一 香农信息论的基本点 用随机变量或随机矢量来表示信源 运用概率论和随机过程的理论来研究信息 二 信源的分类 按照信源发出的消息在时间上和幅度上的分布情况可将信源分成离散信源和连续信源两大类 信源 离散信源 连续信源 3 连续信源连续信源是指发出在时间和幅度上都是连续分布的连续消息 模拟消息 的信源 如语言 图像 图形等都是连续消息 离散信源离散信源是指发出在时间和幅度上都是离散分布的离散消息的信源 如文字 数字 数据等符号都是离散消息 离散信源 离散无记忆信源 离散

2、有记忆信源 发出单个符号的无记忆信源 发出符号序列的无记忆信源 发出符号序列的有记忆信源 发出符号序列的马尔可夫信源 4 离散无记忆信源离散无记忆信源所发出的各个符号是相互独立的 发出的符号序列中的各个符号之间没有统计关联性 各个符号的出现概率是它自身的先验概率 离散有记忆信源离散有记忆信源所发出的各个符号的概率是有关联的 发出单个符号的信源发出单个符号的信源是指信源每次只发出一个符号代表一个消息 发出符号序列的信源发出符号序列的信源是指信源每次发出一组含二个以上符号的符号序列代表一个消息 5 发出符号序列的有记忆信源发出符号序列的有记忆信源是指用信源发出的一个符号序列的整体概率 即联合概率

3、反映有记忆信源的特征 发出符号序列的马尔可夫信源发出符号序列的马尔可夫信源是指某一个符号出现的概率只与前面一个或有限个符号有关 而不依赖更前面的那些符号 这样的信源可以用信源发出符号序列内各个符号之间的条件概率来反映记忆特征 6 三 先验概率及概率空间的形式 一个离散信源发出的各个符号消息的集合为 它们的概率分别为 为符号 的先验概率 先验概率 一般信源可用一个概率空间来描述 信源的不确定程度可用该概率空间的可能状态数目及其概率来描述 状态空间 7 信息论所关心的就是这种随机变量的不确定性 驱使我们对随机变量进行观察和测量 从中获取信息 8 问题 什么叫自信息量 什么叫不确定度 什么叫互信息量

4、 什么叫平均自信息量 什么叫条件熵 什么叫联合熵 联合熵 条件熵和熵的关系是什么 熵的性质有哪些 什么叫平均互信息量 什么叫信源熵 如何计算离散信源熵 第二节离散信源的信息论概念 9 一 自信息量 1 信息量 2 自信息量 3 不确定度 4 联合自信息量 5 条件自信息量 本节的重点内容 10 I 信息量 不确定程度的减少量 一 自信息量 1 信息量 定义 一个随机事件的自信息量定义为其出现概率对数的负值 2 自信息量 即收信者收到一个消息后 所获得的信息量等于收到信息前后不确定程度减少的量 举例 11 c 因为概率越小 的出现就越稀罕 一旦出现 所获得的信息量也就较大 由于是随机出现的 它是

5、X的一个样值 所以是一个随机量 而是的函数 它必须也是一个随机量 说明 a 自信息量是非负的 b 对于离散无记忆信源 符号串中各符号统计独立 符号串自信息量具有可加性 12 d 自信息量单位的确定在信息论中常用的对数底是2 信息量的单位为比特 bit 用log2或lb表示 bit 符号 若取自然对数 则信息量的单位为奈特 nat 用loge或ln表示 nat 符号 若以10为对数底 则信息量的单位为哈脱莱 Hartley 用log10或lg表示 hartley 符号 若对数底为r 则信息量的单位为r进制用单位 符号 这三个信息量单位之间的转换关系如下 1nat log2el 433bit lH

6、artley log2103 322bit 13 定义 随机事件的不确定度在数量上等于它的自信息量 说明 两者的单位相同 但含义却不相同 具有某种概率分布的随机事件不管发生与否 都存在不确定度 不确定度表征了该事件的特性 而自信息量是在该事件发生后给予观察者的信息量 3 不确定度 14 一个出现概率接近于1的随机事件 发生的可能性很大 所以它包含的不确定度就很小 反之 一个出现概率很小的随机事件 很难猜测在某个时刻它能否发生 所以它包含的不确定度就很大 若是确定性事件 出现概率为1 则它包含的不确定度为0 15 几个关于自信息量的例子 1 一个以等概率出现的二进制码元 0 1 所包含的自信息量

7、为 I 0 I 1 log2 1 2 log22 1bit 符号 2 若是一个m位的二进制数 因为该数的每一位可从0 1两个数字中任取一个 因此有2m个等概率的可能组合 所以I log2 1 2m mbit 符号 就是需要m比特的信息来指明这样的二进制数 16 3 具有四个取值符号的随机变量各符号概率相等 均为1 4 各符号的自信息量 注 bit的含义是二进制数字 0 1 自信息量为2 bit 符号 意味着其不确定性可用2位二进制数字来度量 00 01 10 11 若取4为对数底 自信息量为1 四进制单位 符号 意味着其不确定性可用1位四进制数字来度量 0 1 2 3 17 4 英文字母中 e

8、 出现的概率为0 105 c 出现的概率为0 023 o 出现的概率为0 001 分别计算它们的自信息量 解 e 的自信息量I e lb0 105 3 25 bit 符号 c 的自信息量I c lb0 023 5 44 bit 符号 o 的自信息量I o lb0 001 9 97 bit 符号 18 5 某离散无记忆信源 DMS DiscreteMemorylessSource 的概率空间为信源发出消息202120130213001203210110321010021032011223210 求该消息的自信息量以及消息中平均每符号的自信息量 19 解 信源符号的自信息量 单位都是bit 符号

9、信源无记忆 发出的符号串中各符号统计独立 由自信息量的可加性 符号串自信息量等于各符号自信息量之和 平均一个符号的自信息量 20 6 同时抛掷一对质地均匀的骰子 每个骰子各面朝上的概率均为1 6 试求 a 事件 3和5同时发生 的自信息量 b 事件 两个1同时发生 的自信息量 c 事件 两个点数中至少有一个是1 的自信息量 解 a 存在两种情况 甲3乙5 甲5乙3 P A 1 36 2 1 18 I A lbP A 4 17 bit b 存在一种情况 甲1乙1 P B 1 36 I B lbP B 5 17 bit c P C 1 5 6 5 6 11 36 I C lbP C 1 17 bi

10、t 21 7 在布袋中放入81枚硬币 它们的外形完全相同 已知有一枚硬币与其它80枚硬币重量不同 但不知这个硬币比其它硬币的重量是重还是轻 问确定随意取出的一枚硬币恰好是重量不同硬币的所获得的信息量是多少 并进一步确定它比其它硬币是重还是轻所需要的信息量是多少 解 a P A 1 81 I A lbP A 6 34 bit b P B 1 2 P P A P B 1 162 I lbP 7 34 bit 22 4 联合自信息量 bit 二元符号 随机变量Z是两个随机变量X Y的联合 即Z XY 其概率空间 二元联合符号的自信息量称为联合自信息量 同理 三元联合符号的联合自信息量 bit 三元符

11、号 23 注意 当 xi yj 相互独立时 有P xi yj P xi P yj 那么就有I xi yj I xi I yj xi yj 所包含的不确定度在数值上也等于它们的自信息量 24 定义 注意 在给定yj条件下 随机事件xi所包含的不确定度在数值上与条件自信息量相同 但两者含义不同 5 条件自信息量 bit 符号 定义两种条件自信息量 bit 符号 25 条件自信息量物理意义 26 几个关于条件自信息量的例子 27 1 由于棋子落入任一方格都是等可能的 则 棋子落入某方格的不确定性就是自信息量 bit 符号 28 解 设A表示 大学生 这一事件 B表示 身高1 6m以上 这一事件 则

12、P A 0 25 P B 0 5 P B A 0 75 因此 P A B P AB P B P A P B A P B 0 75 0 25 0 5 0 375 I A B lbP A B 1 42 bit 2 居住在某地区的女孩中有25 是大学生 在女大学生中有75 是身高1 6m以上的 而女孩中身高1 6m以上的占女生总数的一半 假如我们得知 身高1 6m以上的某女孩是大学生 的消息 问获得多少信息量 29 二 互信息量 30 互信息量 设观察输入为 设观察结果为 从yj中得到有关输入符号xi的信息 称为xi与yj之间的互信息量 事件信息 注意与联合自信息量符号标志不同 信息 先验不确定性

13、后验不确定性 xi在观察到yj前不确定性 xi在观察到yj后不确定性 31 1 yj对xi的互信息I xi yj I xi yj I xi I xi yj 含义 互信息I xi yj 自信息I xi 条件自信息I xi yj I xi 信宿收到yj之前 对信源发xi的不确定度 I xi yj 信宿收到yj之后 对信源发xi的不确定度 I xi yj 收到yj而得到 关于xi 的互信息 不确定度的减少量 p xi 先验概率 信源发xi的概率p xi yj 后验概率 信宿收到yj后 推测信源发xi的概率 即互信息量为后验概率与先验概率比值的对数 32 2 xi对yj的互信息I yj xi 含义 信

14、源发xi前 后 信宿收到yj的不确定度的减少 3 I xi yj I xi I yj I xi yj 注意 I xi yj 与I xi yj 不同 33 4 实在信息 后验概率p xi yj 1 即收到yj时就能完全肯定此时的输入一定是xi xi的后验不确定性完全消除 即从输出结果中得到了输入实有的全部信息 实在信息 注意 a 输入的先验不确定性在数值上等于自身含有的实在信息 b 信息与不确定性是两个不同的物理概念 不是信息 只是不确定性 互信息量才是信息 把当作信息只是说明一种数量上的相等关系 胡扯 34 4 互信息量定义扩展 符号xi与符号对yjzk之间的互信息量定义为 35 2 互信息的

15、性质 具体推导可见课本p24 1 对称性 I xi yj I yj xi 2 X与Y独立时 I xi yj 0 3 I xi yj 可为正 负 0当事件xi和yj统计独立时 互信息量为零 互信息量为正 说明yj的出现有助于减小xi的不确定性 反之 互信息量为负说明yj的出现增大了xi的不确定性 比如信道存在干扰 4 任何两个事件之间的互信息量不可能大于其中任意事件的自信息量 36 I xi yj 可为正 负 0的举例设yj代表 闪电 则当xi代表 打雷 时 I xi yj 0 I xi yj I xi 0当xi代表 下雨 时 I xi yj I xi I xi yj 0当xi代表 雾天 时 I

16、 xi yj I xi I xi yj 0当xi代表 飞机正点起飞 时 I xi yj I xi I xi yj 0 37 3 条件互信息量给定zk条件下 xi与yj间的互信息量是 另外 还存在xi与yjzk之间的互信息量 38 该式推导见p25 26 由上述两式得 说明 一个联合事件yjzk出现后提供的有关xi的信息量 zk事件出现后提供的有关xi的信息量 在给定zk条件下再出现yj事件后所提供的有关xi的信息量 39 4 关于互信息的例子已知信源发出两种消息 且此消息在二进制对称信道上传输 信道传输特性为 求互信息量 解 根据得到 40 一个布袋内放100个球 其中80个球是红色的 20个球是白色的 若随机摸取一个球 猜测其颜色 求平均摸取一次所能获得的自信息量 解 依据题意 这一随机事件的概率空间为 三 平均自信息量 熵 41 其中 x1表示摸出的球为红球事件 x2表示摸出的球是白球事件 如果摸出的是红球 则获得的信息量是I x1 log2p x1 lb0 8 0 322bit如果摸出的是白球 则获得的信息量是I x2 log2p x2 lb0 2 2 322bit 如果每次摸出

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号