2018-04-24

为什么你被“杀熟”?谈一谈 iOS App 与用户隐私

最近这段时间,和用户隐私相关的雷一个接一个的爆了。

3月2号,携程被爆出利用大数据杀熟,同样的酒店,同样的房间,同样的时间,不同用户价格却不一样。

3月17日,纽约时报和英国卫报同时报道了剑桥分析公司在未经用户许可的情况下利用社会调查 App 违规获取 Facebook 上 5000 万名用户个人信息(后证实数据泄漏量达到 8700 万)。

3月23日,网友爆出滴滴打车 App 利用大数据杀熟,同样的路程,同样的时间,价格不一样。

3月26号,百度的李总信心满满的说:中国人愿意用隐私换便利… Excuse me?继续赚你的钱不好么?出来代表所有人,连央视都看不下去了

Excuse me?

Excuse me? 图片来源

  • 如果你不在乎你的隐私,觉得“我没有什么好隐藏的”,下面的内容可以不用看了。
  • 如果作为普通 iOS 用户,希望了解如何避免被大数据割韭菜,请往下看。

为什么不说安卓的 App 呢?这一类的文章已经是老生常谈了,比如:中国人隐私不值钱?实测国产App拿隐私有多丧心病狂,这里就不重复了。

背锅

这锅我安卓背了

用数据换服务

只要是正常使用过一些大型互联网公司的 App,尤其是注册登陆过,用户即贡献了自己的数据。“杀熟”这种行为,只要还没有出台相关法律法规明文禁止,“理论上”都是合理存在的。不然,那些去 BAT 做 BI 等职位的伙伴们的价值怎么体现呢?

作为运营方,要求用户注册,除了获取用户的信息之外,很重要的一点即使每一个用户变得“可追溯”,这种可追溯的程度经常为隐私保护者们所诟病。为了更好地使用数据来驱动和优化运营,运营方往往会尽一切力量抓取所有数据,导致最终尽管用户数据可能是匿名的,但是却包含了关于个体详尽的信息。

比如我们看一个新闻阅读 App 在用户未登陆时发出的某一个请求:

https://api.dummydomain.com/api/channel/v6/news.go?channelId=1&num=20&page=1&groupPic=1
&imgTag=1&showSdkAd=1&rt=json&from=channel&focusPosition=1&lastUpdateTime=0&mainFocalId
=0&viceFocalId=0&cursor=0&times=0&rr=1&action=0&subId=0&contentToken=123e8762ec8584b5e5
fd35d146f78da6&forceRefresh=0&isMixStream=2&isFirst=0&trainContentToken=123ebbcf8fcd4d0
d907e25f67598655b&picScale=11&mode=0&source=4&categoryId=2&apiVersion=40&u=1&isSupportR
edPacket=0&skd=67842829ecb0c265af373bc63fc78dcf57ce17cbd093e9aaf8afa7515a4894b4a5e14790
b3415fb21d0aa34ce4ee3c49e7b2e6d53df970a58f01f240d54a98756aaf163ef08f2f5be8802210ad47668
8&v=1524412800&t=1524480876&net=wifi&abt=1&actiontype=1&openudid=012a297d0ae3792e951114
8776fde4008eacc0c1&mac=02:00:00:00:00:00&density=2.000000&idfv=123441F2-3547-4055-BBE8-
87BE4AE5924F&carrier=中国电信&nets=wifi&adsid=123441F2-3547-4055-BBE8-87BE4AE5924F&idfa=
00000000-0000-0000-0000-000000000000&p1=NjM2NTQ3NTkxODQ3NTM0MTg0NA==&pid=-1&sid=18

作为一个新闻 App,前面的十几个参数都属于正常业务范围,定义获取新闻栏目,获取新闻数量,新闻页码,上次更新时间等等。如果我们往后看,这个 App 的每一个请求都会同时回传一些其他的用户信息,比如你的网络状态( WiFi 或者流量),设备 Mac 地址(出于隐私保护,新版 iOS 已经不允许获取了),运营商名称,AB 测试组等等。而后面这些参数提供与否,理论上是不应该影响用户使用新闻服务的。

在某种程度上可以说,用户,不论付费与否,都是在贡献数据的同时换取服务。这些数据对于运营方来说即沉淀下来的价值,如果一台特定设备喜欢看“美食类”、“育儿类”、“职场类”的新闻,不喜欢“军事类”,“游戏类”的新闻,那么这台设备的主人画像很有可能是一位年轻妈妈,可以精准地推送内容和产品。

再来看另外一个 App 在用户未登陆时发出的某一个请求:

https://acs.youku.com/gw/mtop.youku.haibao.appconfig.load/1.0%3Frnd%3DF702D1E226C6E73E6
27B2333DF65E28C%26data%3D%7B%22system_info%22%3A%22%7B%5C%22osVer%5C%22%3A%5C%2211.4%5C
%22%2C%5C%22scale%5C%22%3A2%2C%5C%22appPackageKey%5C%22%3A%5C%22com.youku.YouKu%5C%22%2
C%5C%22ouid%5C%22%3A%5C%22abcdebcba3c1565a81c6db804f6abebe996b92efb%5C%22%2C%5C%22idfa%
5C%22%3A%5C%22ABCDAB0C-A520-44A4-8972-B67AF4F5D8AF%5C%22%2C%5C%22brand%5C%22%3A%5C%22ap
ple%5C%22%2C%5C%22childGender%5C%22%3A0%2C%5C%22os%5C%22%3A%5C%22ios%5C%22%2C%5C%22ver%
5C%22%3A%5C%227.2.5%5C%22%2C%5C%22operator%5C%22%3A%5C%22%E4%B8%AD%E5%9B%BD%E7%94%B5%E4
%BF%A1_46009%5C%22%2C%5C%22network%5C%22%3A%5C%22WIFI%5C%22%2C%5C%22btype%5C%22%3A%5C%2
2iPhone9%2C1%5C%22%2C%5C%22resolution%5C%22%3A%5C%221334%2A750%5C%22%2C%5C%22pid%5C%22%
3A%5C%2269b81504767483cf%5C%22%2C%5C%22device%5C%22%3A%5C%22IPHONE%5C%22%7D%22%2C%22dev
ice%22%3A%22IPHONE%22%2C%22debug%22%3A0%2C%22type%22%3A%22skin%2Cplayer_uplus%2Cplayer_
h265%2Cplayer_ios_config%2Cinit_reminder_info%2Cinit_update_info%2Cinit_other_info%2Cpl
ayer_common_config%2Ctheme_skin_list%22%2C%22extra%22%3A%22%7B%5C%22theme_skin_type%5C%
22%3A%5C%22get_config%5C%22%2C%5C%22user_skinid%5C%22%3A%5C%220%5C%22%7D%22%2C%22layout
_ver%22%3A100000%7D

每个请求也都带上了:

  • 设备型号
  • 设备名称
  • 系统版本
  • 运营商名称
  • 网络状态
  • 屏幕分辨率
  • 皮肤设定

等等参数,并加了签名。

可以看到,App 的请求中大量加参,使每个用户尽量可追溯,是大家的普遍做法。想象一下,当你将一个商品加入了购物车却没有下单,一周后再次打开这个应用,运营方推送给你一条消息,“Hey,我们觉得你会喜欢某某商品,如果和已加入购物车的某某商品一起购买,可以打 8 折”,是不是很有杀伤力?

可怕的杀伤力

可怕的杀伤力 图片来源

你愿意让与出多少数据来换取服务?虽然每个人答案不一样,但在 iOS 相对封闭的权限下,偶尔我们也能看到在冷启动时给用户在背地里刷 30 多个广告联盟流量的大厂 App(就不点名了),或者每个请求都带上 60 多个详尽的参数,方便给分析师们做 funnel analysis 的 App。此时也只能感叹一下,虽然大家都不容易,但是这样的产品,我们是敬而远之的。

控制自己让与的数据量,善用工具 App

在不影响正常使用各大互联网服务的前提下常见的一些办法:

  • 使用 Mobile Safari 的 “无痕浏览” 模式,可以防止不同标签页中的追踪;

    无痕浏览
  • 使用 Mobile Safari 的 “内容拦截器”,过滤追踪和统计服务,比如 AdGuard(免费);
  • 打开 设置 - Safari 中的 “不跟踪”(Do Not Track);
  • 可以在家用路由上,或者单个设备上架设一层转发代理,去掉追踪和统计代码服务,去掉请求中多余的参数(有的请求记得需要重新签名);
  • 仅注册真正需要的 App 服务,注册前查看服务商的隐私和服务条款;
  • 同一个服务,如果有网页版,在不影响体验的前提下优先使用网页版。

最后,作为有判断力的用户,对于一些通过机器学习、挖掘用户数据并给予个性化推荐的 App,应该有所保留。尤其是阅读类应用,我们不应让机器左右我们的思考,不应让一个入口取代并为我们过滤了所有的新闻来源。这也是为什么在阅读和知识管理上,我们一直坚持使用 RSS 的原因。

隐私就像安全一样,虽然始终是一个小众市场,但并不妨碍我们去坚持,以保证我们独立、客观去思考问题的能力。这次我们把一直在内部使用的 RSS 阅读器 Reedr 发布了出来,如果你:

  • 习惯使用 RSS 来管理自己的阅读;
  • 在意自己的阅读和浏览隐私;
  • 希望保持自己的独立思考的能力。

那么,推荐你试试 Reedr:

Reedr

Reedr

注重隐私保护的 RSS 阅读器

你的数据,说到底其实都是自己在有意或无意中发出的。你的隐私,除了你自己,很少会有人来真正为你保护。

(End)


本文采用 知识共享 署名-非商业性使用-禁止演绎 4.0 国际 许可协议
This article is licensed under Attribution-NonCommercial-NoDerivatives 4.0 International (CC BY-NC-ND 4.0)

沪ICP备15044284号-1