数据挖掘项目实战

      数据挖掘项目实战,主要以kaggle竞赛平台Titanic生存预测为例详细讲解数据挖掘项目的工作流程,具体包括提出问题、理解数据、数据清洗、构建模型、模型评估、方案实施六个基本步骤。

附件-数据挖掘项目实战.pdf

原创文章,作者:admin,如若转载,请注明出处:https://www.isclab.org.cn/2018/05/02/%e6%95%b0%e6%8d%ae%e6%8c%96%e6%8e%98%e9%a1%b9%e7%9b%ae%e5%ae%9e%e6%88%98/

(0)
adminadmin
上一篇 2018年4月23日
下一篇 2018年5月7日

相关推荐

  • 大模型赋能的模糊测试用例生成技术

    随着大模型技术的兴起和发展,软件漏洞模糊测试方法在新技术的赋能下,可以实现更好的代码覆盖率和漏洞发现数量。本次学术报告针对结合大模型实现模糊测试用例生成的方法,介绍了Fuzz4Al…

    2024年9月3日
    2.8K
  • 预训练加密流量表征方法-巩锟

    本次报告从BERT框架入手,讲解基于预训练的加密流量表征方法。首先介绍加密流量分析的问题和挑战,在基本概念部分着重分析BERT输入表示、预训练过程中的MLM和NSP任务,然后以ET…

    2023年8月7日
    2.5K
  • 认知扭曲识别研究

    认知扭曲是认知行为治疗中的核心概念,与抑郁、焦虑等心理障碍的形成和维持密切相关,但现有很多研究主要关注情绪倾向或表层语义,难以刻画个体更深层的思维偏差与认知模式,同时认知扭曲往往存…

    2026年4月8日
    1.7K
  • LDA主题模型浅析

          LDA主题模型可以将文档集中每篇文档的主题按照概率分布的形式给出。同时它是一种无监督学习算法,在训练时不需要…

    2018年7月3日
    2.6K
  • 源代码自动化编辑方法

    代码自动编辑任务通过应用频繁出现的编辑模式对现有代码进行修改,能够提升软件开发的效率。CODIT方法将代码编辑过程建模为树结构变换和标记生成两个阶段。MODIT方法输入整合需要编辑…

    2022年7月10日
    2.4K
  • 基于网络流量的设备识别

    介绍了设备识别的发展历史、各层协议的特征及其优劣性,对两篇关于内网、外网识别的高水平文献进行了讲解,对比了设备识别的主要研究方向,以期帮助初学者快速了解领域内的动态及发展前景。

    2020年10月8日
    3.6K
  • HTTPS浅析

        HTTPS(全称:Hyper Text Transfer Protocol over Secure Socket Layer),是以…

    学术报告 2018年3月18日
    2.7K
  • 联邦学习

    联邦学习(Federated Learning)在2016年由谷歌最先提出,其设计目标是在保障大数据交换时的信息安全、保护终端数据和个人数据隐私、保证合法合规的前提下,在多参与方或…

    2020年6月7日
    3.4K
  • 网络安全态势感知

    随着网络技术的飞速发展,其安全问题日益突出。虽然已经采取了多种网络安全防护措施,但是单一的安全防护措施没有综合考虑各种防护措施之间的关联性,无法从宏观角度评估网络安全性。网络安全态…

    2020年4月21日
    3.0K
  • TCP之可靠数据传输

          TCP协议是面向连接的可靠数据传输协议,如何在不可靠协议IP协议的上层实现可靠数据传输,主要通过差错检验、分…

    学术报告 2018年4月10日
    2.4K