AI算法工程师手册-六、先验分布与后验分布

六、先验分布与后验分布

  1. 在贝叶斯学派中,先验分布+数据(似然)= 后验分布
  2. 例如:假设需要识别一大箱苹果中的好苹果、坏苹果的概率。 根据你对苹果好、坏的认知,给出先验分布为:50个好苹果和50个坏苹果。 现在你拿出10个苹果,发现有:8个好苹果,2个坏苹果。 根据数据,你得到后验分布为:58个好苹果,52个坏苹果 再拿出10个苹果,发现有:9个好苹果,1个坏苹果。 根据数据,你得到后验分布为:67个好苹果,53个坏苹果 这样不断重复下去,不断更新后验分布。当一箱苹果清点完毕,则得到了最终的后验分布。 在这里: 如果不使用先验分布,仅仅清点这箱苹果中的好坏,则得到的分布只能代表这一箱苹果。 采用了先验分布之后得到的分布,可以认为是所有箱子里的苹果的分布。 当采用先验分布时:给出的好、坏苹果的个数(也就是频数)越大,则先验分布越占主导地位。
  3. 假设好苹果的概率为 ![六、先验分布与后验分布 - 图1] 个的概率为一个二项分布:

六、先验分布与后验分布 - 图4 其中 ![六、先验分布与后验分布 - 图5] 为组合数。

  1. 现在的问题是:好苹果的概率 ![六、先验分布与后验分布 - 图6] 不再固定,而是服从一个分布。 假设好苹果的概率 ![六、先验分布与后验分布 - 图7] 。 则后验概率为:

六、先验分布与后验分布 - 图9 归一化之后,得到后验概率为:

六、先验分布与后验分布 - 图1

  1. 好苹果概率 ![六、先验分布与后验分布 - 图11] 。 根据上述例子所述:

  2. 好苹果的先验概率的期望为 六、先验分布与后验分布 - 图1

  3. 进行第一轮数据校验之后,好苹果的后验概率的期望为 六、先验分布与后验分布 - 图1

  4. 如果将 六、先验分布与后验分布 - 图1

  5. 这里使用先验分布和后验分布的期望,因为 六、先验分布与后验分布 - 图2

  6. 更一般的,如果苹果不仅仅分为好、坏两种,而是分作尺寸1、尺寸2、...尺寸K等。则 ![六、先验分布与后验分布 - 图23] 的苹果的概率服从多项式分布:

六、先验分布与后验分布 - 图2

其中苹果为尺寸1的概率为 六、先验分布与后验分布 - 图2

  • 假设苹果尺寸的先验概率分布为狄利克雷分布:六、先验分布与后验分布 - 图3 苹果尺寸的先验概率分布的期望为:![六、先验分布与后验分布 - 图35] 。

  • 则苹果尺寸的后验概率分布也为狄里克雷分布:六、先验分布与后验分布 - 图3 苹果尺寸的后验概率分布的期望为:![六、先验分布与后验分布 - 图37] 。

文章列表

更多推荐

更多
  • Pharo敏捷人工智能-第一部分:神经网络
    Apache CN

  • Pharo敏捷人工智能-第二部分:遗传算法
    Apache CN

  • Pharo敏捷人工智能-# 第三部分:神经进化 第三部分:神经进化
    Apache CN

  • Azure数据工程指南-二十四、数据治理的权限 创建 azure 预览帐户,探索 azure 预览,探索词汇表,浏览资产,以编程方式使用预览,摘要,管理凭证和访问,创建扫描, 许多组织需要建立数据治理流程、标准和方法,并且已经能够使用内部 SQL Server 工具(如 Master
    Apache CN

  • Azure数据工程指南-二十二、Synapse 分析工作区 创建 Synapse 分析工作区,使用 Spark 探索样本数据,用 SQL 查询数据,用 SQL 创建外部表,摘要, 微软 Azure 数据平台的众多新增功能已经围绕许多类似的产品及其在现代 Azure 数据平台中的用途产生了兴奋和困
    Apache CN

  • Azure数据工程指南-二十三、数据块中的机器学习 创建 MLflow 实验,安装 MLflow 库,创建笔记本,选择性测井,自动记录,摘要, 寻求利用机器学习(ML)和人工智能能力的组织和开发人员花费大量时间构建 ML 模型,并寻求一种方法来简化他们的机器学习开发生命周期,以跟踪实验,
    Apache CN

  • Azure数据工程指南-二十一、将 Apache Spark 的 GraphFrame API 用于图形分析 安装 JAR 库,加载新数据表,将数据加载到数据块笔记本中,用顶点和边构建一个图,查询图表,寻找有图案的图案,用 PageRank 发现重要性,探索入度和出度度量,摘要,进行广度优先搜索,查找连接的组件, 图形技术使用户能够以图形的形式
    Apache CN

  • Azure数据工程指南-20 二十、部署 SQL 数据库先决条件,创建 Visual Studio SQL 数据库项目,安装 Visual Studio GitHub 扩展,导入 AdventureWorks 数据库,连接到 GitHub Repo 源代码控制,将
    Apache CN

  • Azure数据工程指南-十九、部署数据工厂更改 先决条件,创建 DevOps 持续集成构建管道,创建 DevOps 持续部署发布渠道,验证部署的数据工厂资源,摘要,Azure PowerShell 任务停止触发器,ARM 模板部署任务,Azure PowerShell 任务启动触发器
    Apache CN

  • Azure数据工程指南-十八、用于 Cosmos DB 的 Azure Synapse 链接 创建一个 Azure Cosmos DB 帐户,启用 Azure Synapse 链接,创建一个 Cosmos DB 容器和数据库,将数据导入 Azure Cosmos DB,在 Azure Synapse Analytics 中创建
    Apache CN

  • 近期文章

    更多
    文章目录

      推荐作者

      更多