浅谈大数据的标签管理

浅谈大数据的标签管理最近参与了一个大数据的项目,是涉及标签管理方面的内容,使我这个初涉入大数据领域的人获益匪浅。标签,也可以叫做Tag,最早出现于2005年(注1),随着Web2.0的Blog应用被广泛使用开来。标签也可以说是一种关键词标记,可以更好的显示和突出搜索的关键词条,以便进行更好的索引和浏览查找。但标签又不同于平常的关键词,它可以使用文章或日志中根本没有出现过的词条来标记。比如一篇关于产品方面的文章,通篇…

大家好,又见面了,我是你们的朋友全栈君。

最近参与了一个大数据的项目,是涉及标签管理方面的内容,使我这个初涉入大数据领域的人获益匪浅。

标签,也可以叫做Tag,最早出现于2005年(注1),随着Web2.0的Blog应用被广泛使用开来。标签也可以说是一种关键词标记,可以更好的显示和突出搜索的关键词条,以便进行更好的索引和浏览查找。但标签又不同于平常的关键词,它可以使用文章或日志中根本没有出现过的词条来标记。比如一篇关于产品方面的文章,通篇没有任何产品这个词条,但却可以打上产品标签,来更好的指向这个文章的内容性。

标签有两个非常明显的特征:

n 可重复标记性
对同一个用户,可以打上很多个标签。所以标签不同于传统意义上的分类,它也被称为“开放分类”。而且同一个用户身上的标签数量,会随着时间的推移而持续不断的被增加。标签数据越多,最后得到的用户受众画像信息会越来越完整。

例如男性用户A,喜欢浏览汽车网站,同时爱好音乐和收藏。可以对他打的标签就有男性,网站,汽车,音乐,收藏。而过了一段时间,他结婚有了小孩,同时喜欢上淘宝购买母婴用品,这时他又会被标记上已婚,有小孩,在线购物,母婴的标签。
浅谈大数据的标签管理

n 指向明确性
每个标签都指向用户的一类属性或行为。属性不仅包括性别、年龄、身高、体重等信息,甚至还包括一些家庭成员,联系方式,地址等敏感隐私信息;行为则是指某段时间内用户的参与倾向性。行为指向与时间有一定的关系,比如这段时间我有购房的需求,会经常浏览×××网站,这时会产生×××相关的标签。但过了不久我买到了心仪的房子,而不再关注×××时,指向×××行为相关的标签就可能已经失效。

还是上面用户A的例子:
ü 标签男性可归纳为用户的性别属性;
ü 标签网站、汽车、音乐、收藏、在线购物、母婴可归纳为用户的爱好或预购意向属性;
ü 标签已婚,有小孩则可归纳为用户的婚姻和家庭属性;
    浅谈大数据的标签管理

正是基于标签的这两个特征,所以它在精准营销方面发挥了独特的效用。首先网站将用户的各种在线行为转化为标签数据,并分析大量已收集到的标签数据得到相对完整的受众用户画像。然后将画像信息与DSP,SSP,Ad Exchange等广告平台做对接,平台根据每个广告主的投放需求过滤受众画像,来将每个广告精确曝光给最为匹配的目标用户,从而达到精准营销的目的。

营销的精准性,在于匹配最为符合的受众用户画像。而要确定到最符合的画像信息,又基于对大数据量的标签数据的分析。随着网站的用户数和访问频率的提升,标签数据会相应产生几何级的增长;同时现在各互联网公司也逐渐倾向于标签数据的交换和共享,来获取更丰富的受众信息。所以在大数据领域,对海量标签数据的管理已经成为日趋重要的需求。

现在市面上已经存在的标签管理系统,比较出名的有商业付费工具如Ensighten、TagMan、Tealium、Satellite、OpenTag、Tag Commander、Super Tag、Site Tagger、Bright Tag等,也有Google提供的免费工具Tag Management。这些工具基本功能大体类似,仅区别于各自的增值服务方面。所以结合未来的发展趋势,标签管理应基本涵盖以下四块主要内容:
浅谈大数据的标签管理

² 数据标签化
通过制定容器、规则、条件将代码发布到网站的页面,来将用户信息转化为标签数据。这是标签管理必备的基本内容。

² 标签数据管理
对海量标签数据的管理,还包括去重,合并,转义等标签数据操作。

² 标签共享和交换
现在各互联网公司逐渐倾向于交换和共享标签数据,来充实已掌握的标签数据。所以这个以往的增值服务,也将变得越来越重要。

² 标签分析
包括受众分析,归因分析,以后与各广告平台对接后的投放效果分析,成本分析等等。

标签是互联网信息时代的一个颠覆,标签管理也是大数据时代的一个重要组成部分,我们也期待更多的新内容新技术出现。

转载于:https://blog.51cto.com/1908030/2054194

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/140378.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 给定一个罗马数字,将其转换成整数_计算并输出给定整数n的所有因子

    给定一个罗马数字,将其转换成整数_计算并输出给定整数n的所有因子问题描述:给定一个整数转换成对应的罗马字符。罗马数字包含以下七种字符:I,V,X,L,C,D和M。字符 数值 I 1 V 5 X 10 L 50 C 100 D 500 M 1000 例如,罗马数字2写做II,即为两个并列的1。12写做XII,即为X+II。27写做…

    2022年9月27日
    0
  • A股和B股的区别_b股是什么股票

    A股和B股的区别_b股是什么股票A股:正式名称是人民币普通股票。它是由我同境内的公司发行,供境内机构、组织或个人(不含台、港、澳投资者)以人民币认购和交易的普通股股票,我国A股股票市场经过几年快速发展,已经初具规模。.B股:正式名

    2022年8月2日
    8
  • 《Android移动应用基础教程》(Android Studio)(第二版)黑马程序员 课后习题答案

    《Android移动应用基础教程》(Android Studio)(第二版)黑马程序员 课后习题答案《Android移动应用基础教程》(AndroidStudio)(第二版)黑马程序员课后习题答案目录第1章Android基础入门第2章Android常见界面布局第3章Android常见界面控件第4章程序活动单元Activity第5章数据存储第7章使用内容提供者共享数据第8章广播机制第9章服务第10章Android事件处理第11章网络编程第1章Android基础入门一、填空题1、dex2、@color3、AndroidManifest.xml4、LogCat二、判断题

    2022年5月27日
    381
  • qmake的使用

    qmake的使用前言在linux环境下进行程序开发时,经常需要使用makefile管理编译代码,特别是一些大型工程,而makefile工具语法晦涩深入研究较为困难,好在有很多工具可以自动生成makefile,qmake就是其中的一种。qmake特点为不同的平台的开发项目创建makefile。可以供给任何一个软件项目使用,而不用管它是不是用Qt写的,尽管它包含了为支持Qt开发所拥有的额外的特征。…

    2022年5月19日
    165
  • Hadoop集群搭建教程(详细)「建议收藏」

    Hadoop集群搭建教程(详细)「建议收藏」需要的安装包:  1.jdk压缩包  2.hadoop压缩包请前往我的github上下载相关安装包开始搭建hadoop集群一.使用VMvare创建两个虚拟机,我使用的是ubuntu16.04版本的因为默认的虚拟机主机名都是ubuntu,所以为了便于虚拟机的识别,创建完成虚拟机后我们对虚拟机名进行修改,我们把用于主节点的虚拟机名称设为master(按自己的喜好创建),把用于从节点的虚拟机名称…

    2022年10月24日
    0
  • Java线程同步:synchronized锁住的是代码还是对象

    Java线程同步:synchronized锁住的是代码还是对象在Java中,synchronized关键字是用来控制线程同步的,就是在多线程的环境下,控制synchronized代码段不被多个线程同时执行。Synchronized既可以对代码块使用,也可以加在整个方法上。 关键是,不要认为给方法或者代码段加上synchronized就万事大吉,看下面一段代码:classSync{ publicsynchronizedvoidtest

    2022年7月15日
    17

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号