首页 > 热点资讯 >新闻内容

数据脱敏——什么是数据脱敏

2021年06月02日 12:06

一、什么是数据脱敏


数据脱敏(Data Masking),又称数据漂白、数据去隐私化或数据变形。

百度百科对数据脱敏的定义为:指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。在涉及客户安全数据或者一些商业性敏感数据的情况下,在不违反系统规则条件下,对真实数据进行改造并提供测试使用,如身份证号、手机号、卡号、客户号等个人信息都需要进行数据脱敏。

生活中不乏数据脱敏的例子,比如我们最常见的火车票、电商收货人地址都会对敏感信息做处理,甚至女同志较熟悉的美颜、有些视频中的马赛克都属于脱敏。


二、为什么要进行数据脱敏


上面说到,在“涉及客户安全数据或者一些商业性敏感数据的情况下”对数据进行改造,说明我们要进行改造的数据是涉及到用户或者企业数据的安全,进行数据脱敏其实就是对这些数据进行加密,防止泄露。

对于脱敏的程度,一般来说只要处理到无法推断原有的信息,不会造成信息泄露即可,如果修改过多,容易导致丢失数据原有特性。因此,在实际操作中,需要根据实际场景来选择适当的脱敏规则。改姓名,身份证号,地址,手机号,电话号码等几个客户相关字段。

三、如何实现数据脱敏


按照脱敏规则,可以分为可恢复性脱敏和不可恢复性脱敏。可恢复性脱敏就是数据经过脱敏规则的转化后,还再次可以经过某些处理还原出原来的数据,相反,数据经过不可恢复性脱敏之后,将无法还原到原来的样子,可以把二者分别看做可逆加密和不可逆加密。

我们目前遇到的场景是日志脱敏,即在把日志中的密码,甚至姓名、身份证号等信息都进行脱敏处理。

脱敏前:


脱敏后:

如上图,仔细分析会发现,打日志之前,获得脱敏的数据就两个步骤:【拿到要输入的数据(user实体)】→【进行序列化】,所以要进行数据脱敏可以考虑在这两个步骤上进行实现。第一个方法就是在序列化实体之前先把需要脱敏的字段进行处理,之后正常序列化;第二个方法就是在实体序列化的时候,对要脱敏的字段进行处理。


相关推荐

租客网:你知道怎样解决房屋押金难退的头疼问题吗?

趁着年少,独自一人在城市打拼,为寻一处安隅,竟耗费了所有剩余的精力。这一路走来,跳过了黑中介,跳过了假房源,终于找到了心仪的房子,激动之余果断签下合同,心中自然美滋滋。等到退房才发现,果然自己太年轻,压给房东的押金是别想要了,各种费用克扣之下,还隐隐有种倒贴的架势。懊恼之余,只能告诫自己下次长点心眼!对于长租房的租客来说,租房过程中的圈套太多了,一个不小心就很容易被坑。这其中,房屋的押金难退就是一个让租客头痛的问题。这其中又分两种情况,一种是合同占据优势,房东本地人,但拒不退还押金。还有一种是合同不占据优势,各种事项克扣。如果遇到第一种,可以打电话到消费者协会,进行协调处理,金额大的可进行民事诉讼,维权之路长漫漫,看谁熬过谁了。如果是第二种,自己的合同本就不占优势,条条框框都在打着“擦边球”,房东吹毛瑕疵挑着房子本就存在的问题,以此用各种名义来克扣租房押金,租客又该怎么办呢?这需要租户在一开始就擦亮眼睛,细细揣摩合同,读懂其中的“深意”,比如房屋及家具受到任何损害则克扣一定比例的押金作为违约金等。入住前,对于房屋的各个地方都要检查一番,小到地板上有一块擦不掉的污渍都给房东报过去,尽量把损失降到最低。当然,这些都是无奈之举,如果租客在一开始就找到好的租赁平台,可能就不会发生这些事儿了。租客网是以“海量真房源、放心租着过”为核心业务板块,竭诚为广大租客服务的互联网租赁平台。在“真房源”这件事上,租客网绝不含糊,保障每一个租客看的和住的都是一样的。租客网通过整合各方资源,起到租客和房东之间的“保姆管家”角色,一方面为公寓主、房东、中介、房产开发商导流,轻松房屋托管,租金如期到账;另一方面做到为广大租客提供高品质、全方位的房屋租赁服务,规避了“虚假宣传、虚假房源、不良中介、无房可租”等问题,让租客们告别找房烦恼,快速租房落脚。同时租客网率先采用“信用体系认证”,提高了平台门槛,规避了一系列的租房骗局问题,“真房源、信用免押金、免中介费、按月交租、可长租、可短租”等特点能够让租客安心入住。租客网,信用免押金,让租客不再遭遇押金强行克扣之苦。你的押金还是你的押金,它不会留房东的钱包里,终究会握在你自己的手中。

2020年05月13日 11:30

中介市场将如何转型与升级?

有人常说住房是刚需。现如今,大批人口离开家乡,到外地工作谋求更好的发展,他们的居住需求就从住房变成了租房,与之息息相关的房屋租赁中介就成为很多人在外租房的首选。而对于“中介”这一行业而言,则充满了许多挑战与难题,特别是对于中小型中介而言,如何在庞大的市场中分得一杯羹,又能独善其身长久的坚持下去?成为很多困扰中小型中介的首要难题。首先,社会上关于“不良黑中介”的偏见就限制住了中小型中介前进的步伐。他们多使用恐吓、恶劣投诉甚至暴力行为对待客户,损害整个行业的形象。使得很多人不敢相信中小型中介,对他们避而远之,极大削弱了客户与房屋来源,从根本上减少了中小型中介的成交房屋数量,并由此形成一个闭合式的恶性循环。其次,面对强大的互联网浪潮,中小型中介毫无招架之力。难以跟上市场节奏,他们通常“各自为政”,没有品牌影响力与社会号召力,没有互联网化的管理工具,房源客源往往局限在门店附近的住宅区,单一门店匹配效率低。只靠线下交易,缺乏线上管理与沟通,无法适应信息化时代中介市场的转型与升级。并且信息效率低,极大程度拖慢了整个租房交易流程。最后也是最重要的一点就是中小型中介实力较弱,无法抵御市场上多重资本入驻后的市场压力。各路资本进驻市场,各品牌门店数量逆市上扬如雨后春笋,并开展一系列如火如荼的地推模式,占据大部分市场份额,而中小型企业只能在市场的洪流中寻找夹缝生存。在如此严峻的市场形势下,中小型中介应该何去何从?就目前整个行业分析,中小中介若想持续发展,一个强有力的助力平台则显得尤为重要。其中,作为互联网租赁行业的新星,租客网的出现无疑是对这些中小型中介的“雪中送炭”。租客网是一家以互联网+为主导的租客官方平台,从源头上弥补了中小型中介线上资源短缺甚至没有的短板,提供强大的房源与客源支持。目前线上已覆盖PC端、租客网APP、租客网手机版等终端,是具备集房源信息搜索、大数据精准匹配、线上门店管理、全民经纪人分享为一体的综合型房产租赁服务功能。让中小型中介的线上资源完成从无到有的量变,进而完成从有到全的质变。同时,租客网拥有海量真房源与强大客源,保证中介的良好高效的持续性运转,与之前“三天打鱼,两天晒网”的工作模式形成鲜明对比,从品牌效应给予中小型中介最直接的支持,利用租客网自身的一系列针对租客与房东的贴心服务,赢得市场口碑,从而使中小型中介“名利双收”。租客网帮助你解决困难,抵御市场风险。目前,已有越来越多的中介选择加盟租客网,正是这种信任与支持,才能使双方在合作共赢的道路上越走越远,你还在等什么?抓住财富先机,掌握市场风向,共赢美好未来!

2020年04月23日 17:09

如何利用伪原创增加自己网站的原创文章

网站在SEO优化中是大家在日常都会做到的工作,而这里面的工作重点就是写原创文章,但对于没有文字功底的网站工作人员来说,写作便是种笔尖上的噩梦,为了解决这个难题,很多小伙伴便把精力集中在了写伪原创,那么什么才是真正的伪原创呢?百度又是如何评判文章的质量呢?要想弄明白这个道理要知道伪原创的定义,百度百科给的定义是:伪原创是指把篇原创的文章进行再加工,使其让搜索引擎认为是篇原创文章,从而提高网站权重。编辑方法有修改标题的关键词和首尾段落总结两种。既然知道了伪原创的定义,那么下面小编和小伙伴们起来分析下,如何写高质量的伪原创,其实所谓的高质量伪原创是将已经发布的片旧的文章经过我们人为的调整改动,又将其发布于网络,同时又巧妙的躲避百度蜘蛛的检索规则,使其认为是篇原创文章,看到这里,我想小伙伴都应该明白做伪原创的精髓在哪里了,我们要做的内容是如何躲避蜘蛛的层层审核,使其认为是篇原创文章。那么问题来了?这些和伪原创又有什么关系呢?其实其中的原理都是相同的,只不过发展到,其数据演变为云计算,功能更加便捷快速而已,下面给大家说下搜索引擎的爬行原理,以此来指导我们写出更好的伪原创。搜索引擎的排名原理,第步要做的是爬行和抓取,以此完成蜘蛛的数据收集任务,步是蜘蛛的链接跟踪,其中将涉及深度优先法则与广度优先法则,第三步将是根据搜集数据建立地址库。第四步是预处理,很多人将此步骤定义为索引,其实这里有必要说明下,预处理包含众多规则,而索引只是预处理中重要的步骤,下面到了我们本次要说的重要的步骤,也是关系我们是否能成功处理伪原创的问题。预处理第步:文字提取,因为正常的网页中包含大量的标签,JS程序等无法用于排名的东西,所以第步将是把这些无法用于排名的东西统统处理干净,只剩下利于我们排名的文字,当然除了这些标签代码外,搜索引擎也会提取出些特殊的信息代码,例如富媒体替代文字等。部是:中文分词,中文分词是搜索引擎特有的步骤,搜索引擎处理页面及用户搜索都是以词为基础,英文等语言单词与单词之间有空格分隔,搜索引擎索引程序可以直接把句子划分为单词的集合。而中文词与词之间没有任何分隔符,个句子中的所有字和词都是连在起的。搜索引擎必须首先分辨哪几个字组成个词,哪些字本身是个词。第三步是:去停止词,无论是中文还是英文,语句中总会包含些嗯,得,的,and,or,the等词语,搜索引擎在索引页面之前会去掉这些词语,以减少无畏的计算。第四步是:消除噪声,绝大部分页面上都会包含对搜索排名没有贡献的些词语,这些词语也将统统被搜索引擎所CUT,接下来将是去重,正向索引,倒排索引,链接关系计算,特殊文件处理,后步是:排名。所以看到这里的小伙伴应该明白单纯的将篇原创文章拿来后经过修改标题,然后关键词植入是不会把搜索引擎蒙蔽的,更何况,XX搜索引擎接二连三的算法层出不穷,又增加了对句子,对段落的各种匹配模式,所以又增加了伪原创的难度,并且伪原创问题已经在各类搜索引擎中加入甄别算法,对核心关键词匹配度达到70%的将被认为为伪原创,并对词意进行分析,对词意相似度达到80%的将定义为伪原创。  作为我们这些辛苦的网站工作者,要做的是合理避开这些规则,让我们的伪原创成为真正的原创。让这些原创,真正的让百度收录,将会具有事半功倍的效果。

2020年04月04日 04:11