爬虫中的攻与防

爬虫技术是获取数据的利器,它避免了繁琐又低效的人工数据搜集。爬虫带来获取数据极大便利的同时,也催生了反爬技术的发展。学术报告以反爬措施以及对抗反爬的手段作为议题,详细介绍了5类反爬的具体流程,并对其优劣做出了总结。反爬措施与对抗反爬手段是大数据时代带来的技术发展,也是攻与防在数据获取层面对抗的缩影。

网络安全-学术报告-爬虫中的攻与防-韩飞-v1.0-2020.05.10

原创文章,作者:bfs,如若转载,请注明出处:https://www.isclab.org.cn/2020/05/10/%e7%88%ac%e8%99%ab%e4%b8%ad%e7%9a%84%e6%94%bb%e4%b8%8e%e9%98%b2/

(2)
bfsbfs
上一篇 2020年5月5日 下午10:17
下一篇 2020年5月17日 下午9:33

相关推荐

  • 偷走你的训练数据:模型反演攻击方法研究

    通过模型反演攻击方法研究,验证了模型训练数据面临泄露风险的问题,并希望以此促进对应防御手段的发展。本次学术报告介绍了模型反演攻击方法的相关知识,并聚焦于两个经典的白盒和黑盒攻击方法…

    2024年2月27日
    3.0K
  • 预训练加密流量表征方法-巩锟

    本次报告从BERT框架入手,讲解基于预训练的加密流量表征方法。首先介绍加密流量分析的问题和挑战,在基本概念部分着重分析BERT输入表示、预训练过程中的MLM和NSP任务,然后以ET…

    2023年8月7日
    2.5K
  • 面向操作系统的模糊测试

    本报告主要介绍了关于面向操作系统的模糊测试方法,探讨了操作系统漏洞挖掘的挑战与常见漏洞类型,详细介绍了模糊测试中的基本概念、常用方法以及两种前沿的Linux内核模糊测试技术ACTO…

    2025年2月9日
    2.4K
  • 检索增强生成系统的知识投毒攻击

    本报告围绕RAG系统知识投毒攻击展开:PoisonedRAG首次揭示知识库投毒攻击面,提出”检索条件+生成条件”的启发式分解框架;Joint-GCG在此基础…

    2026年5月18日
    644
  • 多标签学习

    每天都有大量的数据生成,这导致人们越来越需要新的努力来应对大数据给多标签学习带来的巨大挑战。例如,极端多标签分类是一个活跃且快速发展的研究领域,它处理的分类任务具有极其大量的类别或…

    2021年8月22日
    2.8K
  • 联邦学习的后门攻击方法

    联邦学习在保证数据安全和隐私的情况下解决了数据孤岛和数据碎片化问题,主要分为横向联邦学习、纵向联邦学习和联邦迁移学习。本次学术报告首先介绍联邦学习的历史现状、分类及应用场景,然后通…

    2022年8月30日
    3.1K
  • 启发式参数优化算法举例

    优化问题在日常生活中比较常见,而对于数据挖掘领域优化问题则更为常见,更为普遍。任何一种算法在设计之初必然预留了一组可调的参数,以期通过参数调节来得到算法的最佳效果。因为参数优化问题…

    学术报告 2015年9月9日
    3.6K
  • GBDT梯度提升决策树

          梯度提升决策树(GBDT)是集成学习中梯度提升方法(Gradient Boost)与决策树(Decision…

    2018年5月7日
    2.5K
  • 模型水印攻击方法

    模型水印攻击旨在干扰、破坏或绕过嵌入在模型中的水印信息。本次报告从模型水印攻击的概念入手,分析其原理和应用场景,利用模型水印攻击方法对模型水印算法分析与评估,为模型水印算法的改进提…

    2024年8月19日
    2.8K
  • 时序知识图谱推理方法

    时序知识图谱推理根据历史时序知识图谱中已知事实,预测查询中缺失的实体或关系,避免知识图谱不完整性对知识驱动系统造成的影响。本次学术报告首先讲解了时序知识图谱推理基本概念,然后详细介…

    2023年9月27日
    2.6K