大数据管理概论

大数据管理概论大数据管理概论1大数据隐私1.1引言如今的数据主要大数据的类型隐私特征与类别大数据的隐私风险1.2隐私保护技术匿名化技术数据加密技术差分隐私技术隐私信息检索技术参考文献1大数据隐私1.1引言21世纪网络技术的发展使得个人的隐私无处可藏如今的数据主要大数据的类型1)原生数字化数据这类数据自然产生出来就适合计算机存储的和处理的数据。例如:电子邮件与文本信息,GPS位置数据,关…

大家好,又见面了,我是你们的朋友全栈君。

1 大数据隐私

1.1 引言

  • 21世纪网络技术的发展使得个人的隐私无处可藏

如今的数据主要大数据的类型

1)原生数字化数据
这类数据自然产生出来就适合计算机存储的和处理的数据。例如:电子邮件与文本信息,GPS位置数据,关联电话呼叫的元数据等等,这类数字化的数字信息可以被计算直接利用
2)原生模拟话数据
这类诗句一般为非结构话的数据,例如呼叫的音频与视频,个人健康数据,环境监测数据,超声波检测数据

隐私特征与类别

隐私的类别主要分为以下三类:
1)监视带来的隐私
2)披露带来的隐私:这类隐私是指故意或者无意中想不可信的第三方透露或者遗失数据。该类隐私通常利用匿名化,差分隐私,加密和访问空指技术来保护
3)歧视带来的隐私:大数据处理技术不透明,普通人无法感知和应用,会在无意有意中产生歧视结果

大数据的隐私风险

大数据处理框架 泄露
数据收集 例如在网上搜索医院时,会首先推荐附近医院。
数据集成与融合 在完整服务用户时,收集来自用户各类的消费记录,即使采用了模糊话,匿名化的操作,用户的信息还是容易被攻击者获取到
数据分析 分析用户的各种信息很容易就泄露数据的隐私
数据解释

1.2 隐私保护技术

匿名化技术

匿名化是指隐藏或者模糊数据以及数据源。该技术一般采用抑制,泛化,剖析,切片,分离等操作匿名化。有K-匿名l-diversity,t-closeness

数据加密技术

大数据隐私通常以云平台为依托,实现隐私管理。主要有同态加密,功能加密,安全多方计算等,安全多方计算核心操作是在分布式环境下基于多方参与者提供的数据计算出相应的函数值,并确保除了参与者的输入以及输出信息外,不会额外暴露参与方的任何信息。

差分隐私技术

参考差分隐私技术

隐私信息检索技术

参考文献

[1]孟小峰.大数据管理概论[M].机械工业出版社,2017

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/132697.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • polkitd进程解释

    polkitd进程解释今天想kill-9redis杀不掉然后发现这个是属于服务器方法,可以了解一下supervisor,将需要自启动的程序加入到supervisor的启动配置,只要supervisor不停止,那么监控进程就会一直运行,并且如果出现关闭情况也会被立即重启。…

    2022年6月14日
    114
  • LoadRunner压力测试:测试报告结果分析

    LoadRunner压力测试:测试报告结果分析我们以测试场景“登录-退出”为例,对测试报告的结果进行分析说明。一、测试说明功能登录退出测试目的进行用户登录,评估服务器增长能力场景说明打开登录首页,用户名登录;进入登录后首页页面,点击退出登录事务说明用户登录动态数据说明登录用户名/登

    2022年7月18日
    25
  • windows/linux环境python3出现pip is configured with locations that require TLS/SSL, however the..不可用的解决方法[通俗易懂]

    windows/linux环境python3出现pip is configured with locations that require TLS/SSL, however the..不可用的解决方法[通俗易懂]linux环境下首先明确问题出现原因,是因为openssl版本过低或者不存在so: 查看openssl安装包,发现缺少openssl-devel包 [root@localhost~]#rpm-aq|grepopenssl openssl-0.9.8e-20.el5 openssl-0.9.8e-20.el5 [root@localhost~]# yu…

    2025年7月13日
    5
  • 什么是关联数据[通俗易懂]

    什么是关联数据[通俗易懂]维基百科的定义在计算机领域,关联数据描述了一种发布结构化数据的方法,使得数据能够相互连接起来,便于更好的使用。中文权威期刊的定义关联数据是国际互联网协会(W3C)推荐的一种规范,用来发布和连接各类数据信息和知识。

    2022年7月17日
    18
  • 【笔试题】2019海康威视嵌入式软件开发工程师(BSP)笔试题(附超详细解答)「建议收藏」

    【笔试题】2019海康威视嵌入式软件开发工程师(BSP)笔试题(附超详细解答)「建议收藏」海康威视嵌入式软件工程师的题目只包含两个部分选择题和简答题,也就是说,没有编程题!照样是C语言基础的题量最多了,又因为是BSP方向,所以关于Linux操作系统和驱动方面的题目可能页会比较多一点,但是就题目的总体难度而言,也并不是特别难。但如果对Linux、驱动方面不是很了解的话,估计会很吃亏的。选择题1、若有8个待排序元素,采用冒泡排序和插入排序最大时间复杂度分别是()。64…

    2022年6月24日
    49
  • 网页性能优化之图片懒加载

    一、前言最近因为需要做一个小网站,但是呢,因为图片比较多,打开网页速度很慢,服务器压力就会很大。不仅影响渲染速度还会浪费带宽,比如一个1M大小的图片,并发情况下,达到1000并发,即同时有1000个人访问,就会产生1个G的带宽。于是就想到了图片懒加载来减轻服务器的压力,优先加载可视区域的内容,其他部分等进入了可视区域再加载,从而提高性能,可以大幅度的提高网页加载速度,效果很明显,于是想着将这个方…

    2022年4月8日
    44

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号