推荐算法如何评估?

一、生活中的算法

当我们遇到一个不认识的英文单词,不借助手机等,我们怎样查英文字典?比如查“operation”这个单词。

有一种方法:

1)拿起字典,翻到中间的位置,看到当前页面以“n”开头的单词

2)接着向后翻,翻到“r”页

3)往前翻,翻到“ol”页

4)往后翻,翻到“op”页

5)在打开的两页里找到“operation”

这样查字典速度会非常快,原因是用到一种算法,名字叫“二分法”。可见算法并不神秘。生活处处有智慧,只是我们疏于觉察。

什么是算法?维基百科对算法的定义如下,算法(Algorithm),指一个被定义好的、计算机可施行其指示的有限步骤或次序,常用于计算、数据处理和自动推理。

二、网信办对推荐算法的治理

3月17日,国新办举行2022年“清朗”系列专项行动新闻发布会。根据央视报道,2022年将开展“清朗·算法综合治理”专项行动,督促整改“信息茧房”“算法歧视”“大数据杀熟”等影响网民生产生活的问题。

央视报道国新办新闻发布会

这是对3月1日开始实行《互联网信息服务算法推荐管理规定》(以下简称《管理规定》)的进一步治理行动。《管理规定》中明确了算法推荐技术,是指利用生成合成类、个性化推送类、排序精选类、检索过滤类、调度决策类等算法技术向用户提供信息。

推荐算法在互联网应用中普遍存在。社交软件、音乐播放、购物软件、外卖软件、电商软件,一言以蔽之,带有社交属性的手机App都使用推荐算法。

《管理规定》要求互联网App,也就是推荐算法提供者,对用户注册、数据安全和个人新保护等方面做了规定。特别的是,不得设置诱导用户沉迷、过度消费,以及需要建立用户自主选择机制等。

三、推荐算法有原罪吗?

推荐算法在大多数情形下,对用户是有价值的。想象如下情景,你来到一个不太熟悉的城市,打算品尝当地的美食。拿出手机,打开点评App,按照人们对餐厅的评价,软件推荐了10个距离较近的餐厅。你选择一家前往,对菜品和服务都满意。用餐结束后,在App上给出5星好评(也可能是因为可以赠送甜点)。循环往复,为其他人用App时选择提供信息。

这是一个简单的推荐算法,根据人们的评分对商品或者服务评价划分等级。进阶一点,你在某个社交App上有20个好友,他们常去的餐馆、欣赏的影音作品、购买的商品,App也会推荐给你。这就是K最近邻算法KNN(K-Nearest Neighbor)简单化实例。

推荐算法从用户和商品两个角度推荐

人以群分,物以类聚。因为是朋友,很大概率上,你们品味相似,消费能力相近,App将朋友喜欢的内容也推荐给你。

推荐算法有可能泄漏隐私。假如你觉得自己有些私密的东西,比如所看的书籍,就不希望分享给朋友。

推荐算法最为人诟病的是诱导用户沉迷。相同类型的短视频,不停的发送到你面前,不知不觉中时间流逝。App这样做的目的,就是提高用户使用时间,才可以发送营销广告。对用户来说,不仅仅是时间的消耗,还会导致如“信息茧房”的效应。有相关学者发表专著文章等,在此不再展开。感兴趣的读者,可在参考材料中找到相关链接。

由此可见,推荐算法是中立的。关键看如何利用技术。就像核能,可以发电,清洁能源,还可以制造武器。科技向善,希望俄乌冲突尽快结束。

四、推荐算法的评估审计

如何评估一个App的推荐算法是否满足了《管理规定》?通常来讲,有两个方式。其一,设计文档审计,看App的业务模式,用到的大数据算法和AI模型,是否具有《管理规定》所提到的违规行为。其二,看App实际运行的效果审计。可以采用抽样模式,检查App在实际运行中的推荐行为。

我们也看到,在《管理规定》发布后,互联网公司开始了自查自纠,很多App对隐私保护进行更新,提供用户自主关闭推荐算法的选项。

尽管笔者对此审慎乐观,但这是推荐算法治理的良好开端。互联网时代,推荐算法与每个人息息相关。正如新闻发布会上网络管理技术局官员所讲的,推荐算法专项治理,需要广大用户关注自身权益,参与算法治理工作,营造风清气正的网络空间。

参考材料

1.央视网新闻报道

https://news.cctv.com/2022/03/17/ARTIu4iGYERB4XhpnO8guqkG220317.shtml

2.网信办《互联网信息服务算法推荐管理规定》

http://www.cac.gov.cn/2022-01/04/c_1642894606364259.htm

3.微信读书侵犯个人信息权

http://legal.people.com.cn/n1/2020/0731/c42510-31805538.html

4.复旦大学教授徐英瑾:人类认知与信息茧房

https://mp.weixin.qq.com/s/YJxaoH9K3OEADKVbxPDcVA

5.北师大教授喻国明:算法推荐必然导致“信息茧房”效应吗

https://www.thepaper.cn/newsDetail_forward_5410153

版权声明
本站“技术博客”所有内容的版权持有者为绿盟科技集团股份有限公司(“绿盟科技”)。作为分享技术资讯的平台,绿盟科技期待与广大用户互动交流,并欢迎在标明出处(绿盟科技-技术博客)及网址的情形下,全文转发。
上述情形之外的任何使用形式,均需提前向绿盟科技(010-68438880-5462)申请版权授权。如擅自使用,绿盟科技保留追责权利。同时,如因擅自使用博客内容引发法律纠纷,由使用者自行承担全部法律责任,与绿盟科技无关。

Spread the word. Share this post!

Meet The Author