清華大学データ生態管理の最新研究:データ流通共有と多層市場システムの促進

清華大学社会科学学院経済学研究所が主催した「人工知能時代データ生態管理研究課題成果発表シンポジウム」が12日、北京で開催された。国家行政学院、清華大学、中国人民大学、北京師範大学、中国政法大学、中央財経大学、北京航空宇宙大学、同済大学、首都経済貿易大学の十数人の専門家、学者は、データの確権、データの相互接続、データ要素市場、データ生態系などの多方面の問題をめぐって深く討論している。

シンポジウムでは、清華大学社会科学学院経済所副所長、戎珂教授とその研究チームが「人工知能時代データ生態管理研究」(以下報告)を発表した。清華大学社会科学院経済所長の湯珂氏によると、今回の報告はこのデジタル経済シリーズの報告の重要な成果の一つだ。

データ所有権と用益権分立

報告書はデータ、人工知能、データ要素などの関連概念を整理し、データ生態、データ生態管理概念を提出した。データ生態管理において、データ確権はデータ流通と取引の基礎であり、データ市場の健全な発展にとって極めて重要である。

データがどのように確権されているかについて、報告書はデータの使用は2権分立のモデルを堅持しなければならないと考えており、その中でユーザーなどのデータの原発者はデータの所有権を持っており、プラットフォームなどのデータ処理者は原発者の授権などの方法でデータの用益権を持っている。ユーザー授権プラットフォームは、プライバシーが漏洩されず、乱用されないことを保証するためにデータを使用し、異なるプラットフォームが把握しているユーザーデータは、レベルの面では異なるが、データの使用権を享受する面では平等であるべきである。ユーザーの授権を得る限り。

報告書によると、プラットフォームはデータの分類・等級管理を行う必要があり、データ分類・等級授権制度はソースからデータ権の問題を解決するのに役立つという。データ所有権とデータ用益権の二元分立の方法は、データ要素の非競争性、規模報酬の増加などの特徴を十分に発揮し、その上で関連する法律法規と業界基準を確立し、データ要素の取引、流通を促進する。また、このような確権方式は、データ収集者のデータ用益権を明確にし、データのプライバシー保護、流通、取引に法的根拠を提供している。

清華大学法学部の申衛星院長は報告の観点について、データ所有権とデータ用益権の二元分立の確権方式は、経済学におけるパレート改善の原則に合致し、ユーザー授権プラットフォームは個人のプライバシーが漏洩され、乱用されないことを保証する状況でデータを使用し、プラットフォームはデータ用益権を享受していると評価した。ユーザーは、多くのユーザーデータを使用することによってプラットフォームがもたらす収益の一部またはより良いインテリジェントなサービスを得ることもできます。このように個人データに対して確権を行うことは可能であり、データ要素の非競争性、規模報酬の増加などの特徴を十分に発揮することができ、その上で関連する法律法規と業界基準を確立し、データ要素の取引と流通を促進することができる。また、このような確権方式でデータに依存して運営されているインターネット企業やプラットフォーム型企業にはほとんど影響を及ぼさず、逆にこれらの企業がデータの利用権を有し、データのプライバシー保護、流通、取引に法的根拠を提供していることが明らかになった。

ワークショップでは、多くの専門家がデータの確権の重要性を認めています。清華大学社会科学院経済所の謝丹夏副教授は、データの権利が明確でなければ、データの流通、市場取引などに大きな障害をもたらすと述べた。データ要素はすでに労働、土地、資本、知識とともに、5つの生産要素となっている。

北京師範大学インターネット発展研究院の呉沈括院長補佐官は、「データに凝縮された労働価値であるデータ製品として、どのように確権を与えるかは目前に迫っている問題だ。

中国人民大学法学部の熊丙万副教授は、「データの確権に関する大きな問題であり、現在、法学界の共通認識度は全体的に高く、確権である」と述べた。彼は引き続き、理想的な案は、データ上の多重主体の多重権利主張をシステム的に担持することができ、相互の関係を調整することができ、並行して矛盾しないことが望ましいと説明した。

中国政法大学法治政府研究院の趙鵬教授は、どのように合理的に権力を確定し、どのような権利を確定すべきかについて、自分の研究観点を説明した。法理的にも、実際の競争政策的にも、データ財産権の設定には大きな障害があると考えている。法律の観点から見ると、財産権は対世権であり、すべての人に対してシーンを区別せず、契約双方に限らない。「大規模なデータ取引を支えるためにデータ財産権を確認するだけでは、法理的な支えが足りない」。

趙鵬氏は、すでに認められている財産的権利であっても、その保護境界には競争要求によって適度に調整された問題があり、データ集中による制限競争問題はますます明らかになっている。法律を通じてデータ財産権を創出すれば、競争政策の方向とは逆になる可能性がある。このような権利はプラットフォームの独占を激化させる可能性が高いからだ。閉鎖的な傾向。

データの移行と相互運用のルールを確立し、データ要素のフロー共有を推進する

報告書によると、データ権の属がはっきりしていないため、一部のインターネットプラットフォームでは個人データの乱採、データ流通障壁の設置、データ独占の実施、「プラットフォームの二択一」などの市場秩序を破壊する行為が存在し、これらの行為は消費者の権益を侵害するだけでなく、データ市場とデジタル経済の健全な発展を阻害している。

データはどのように標準化されますか?マルチボディ、マルチプラットフォーム間でどのように相互接続しますか?小企業と大企業の間、大企業と大企業の間、プラットフォームとプラットフォームの間で、敏感でない公開データのプラットフォーム間での効率的な流動を奨励していますか?政府データと企業データの間には相互接続が必要ですか?報告書は、データの非競争性と規模報酬の増加性が相互接続をもたらしたことがデータ要素の市場化の本質的な要求であり、相互接続だけがより大きな価値を生むことができると考えている。

北京航空宇宙大学法学部助教授、工業と情報化法治戦略と管理重点実験室弁公室主任の趙精武氏は、現在の相互接続政策は、やはり開放的なリンクを主とし、スーパープラットフォームの自己優遇問題はよく解決されていないと考えている。プラットフォーム間の遮蔽と閉鎖は、インターネットデータ市場全体のガバナンスにおいて最も重要な問題である。

一部の大型プラットフォームは自身の優位性を借りて自己優遇を行い、生態系以外の中小企業を封殺し、これは市場経済秩序全体に対する破壊性が大きく、中小企業が様々な発展の可能性を失うことになる。彼は、プラットフォーム間の遮蔽がユーザー間の共有を遮断し、ユーザーの使用の各種コストを増加させ、ユーザーの選択権を制限し、最終的に消費者の合法的権益を損なうと考えている。

「データ生態管理の重要な一環は反独占監督管理を強化することであり、反独占管理は業界の自律、行政指導と有機的に補完する必要があり、次のデータ生態管理は反独占立法、法執行と緊密に協力しなければならない」。趙精武氏は、独占禁止法の改正のほか、データ相互接続分野におけるスーパープラットフォームの自己優遇問題を解決し、プラットフォーム経済を正常な法治軌道に戻すために、相応の「プラットフォーム法」を公布することができると提案した。

中央財経大学経済学院の徐翔副教授、中国インターネット経済研究院の徐翔研究員は、データ開放において、政府部門間、企業間のデータが互いに通じないのは、使用基準、編集方式、基礎技術の違いなどの問題があるからだと考えている。そのため、将来的には技術標準化だけでなく、データ生態の標準化モデルを構築し、データの相互接続を実現しなければならない。データ等級分類制度は、良いスタートになります。

データの相互接続について、申衛星は、報告書が提出した「個人はデータの所有権を有し、プラットフォームはデータの使用権を持っている」と述べ、これらの権利を制限する必要があるかどうかも考えなければならないと述べた。「絶対権が認められると、他のプラットフォームのデータ使用を排斥する可能性があります。もちろん、ユーザーは再授権、許可を通じて、他のプラットフォームにデータを取得させることができますが、これで重複労働になります。既存のプラットフォームの利益権は、データの障壁を構成すべきですか。デジタル経済の時代には、データの利益権は一定の制限を受けなければなりませんが、制限の理由は何ですか。どの程度ですか。これらの問題は、データ生態にとって極めて重要であるため、考慮する必要があります。」

呉沈括氏は、データの流転共有過程における一連のボトルネック要素に対して、設計共有、アクセス制度を通じて、データの移行と相互操作性を保障する規則を制定し、データ要素と資源の流転を推進し、価値倍増とデジタル経済発展を促進する必要があると考えている。

戎珂チームは、ユーザーデータの携帯性とプラットフォーム間の相互操作性を強化することはプラットフォームの相互接続、価値創造の核心要求であり、インターネットの独占禁止の最新傾向でもあるため、プラットフォーム間の有効な接続の確立を模索し、データの相互操作性を高め、開放生態システムを構築する必要があると述べた。これに対し、個人情報保護法は初めて個人情報の携帯権を規定し、「個人が個人情報を指定した個人情報処理者に移転することを要求し、国家網信部門の規定条件に合致する場合、個人情報処理者は移転の道を提供しなければならない」と規定した。

多層多様化データ市場システムの構築

報告書は、データ分類の等級付け授権はデータの確権を実現する重要な道であり、デジタルプラットフォームが直接ユーザーの自主授権または市場化の授権協定を通じて、合理的かつ合法的に使用データを収集することができ、例えばユーザーの顔、ニックネームなどの個人公開データがユーザーの授権を経てプラットフォームをまたいで流動することができ、それによってデータ要素市場の取引コストを低減することができると提案した。データの確権の需要をよりよく一致させるために、報告書はデータの負の外部性(敏感度)と正の外部性(データフローの市場化可能な授権度)などの特徴から分類されたデータ授権体系を設計し、「多層、多様化」のデータ市場体系を構築し、データ所有権と用益権の二元分離を促進し、データの安全と個人のプライバシーを保護することを提案した。データ要素と製品のスムーズな流通を推進し、データ流通や取引の多様化の需要を満たす。

報告書は、データ市場システムの基本論理と原則に基づき、取引内容と取引モデルの2つの次元から出発し、「多層、多様化」のデータ市場取引システムを構築し、場内取引を奨励し、場外取引を規範化することを提案した。一方、取引内容の次元では、現在既存の2級市場システムを開拓し、多層データ市場を確立し、具体的には3級を含む:第1級市場は主にデータ資源市場を指し、原始データ授権などの問題を解決する。第2級市場は主にデータ要素市場を指し、データ要素は社会生産経営活動に参加し、経済効果を生み出し、電子方式で記録したデータを指す。第3級市場は主にデータ製品とサービス市場を指す。

一方、取引モデルの次元では、データの取引モデルが応用シーン、買い手の異質性の影響を受けるため、多種のデータ取引モデルを確立すべきであり、具体的には3種類を含むべきである:第1の取引モデルは場内集中取引モデルであり、すなわちデータ取引所、取引センターなどのプラットフォームを通じてデータ集中取引を行う。ここでの「場内」とは、取引所に限らず、取引所、取引センターなどを含む政府主導で、遡及可能な集中取引プラットフォームを指す。第2の取引モデルは、集中取引プラットフォームの外でデータ分散取引を行う場外分布取引モデルである。第3の取引モデルは場外データプラットフォーム取引モデルであり、すなわちデータプラットフォームを通じて多角的なデータ取引を行う。

同済大学経管学院の周迪副研究員は、「異なるシーンの異なる階層でのデータの権利と共通認識を達成するために、階層分類のデータ授権メカニズムを設計する必要がある」と述べた。周迪氏は、データ階層分類授権の構想の下で、ユーザーはデータ派生の具体的な権利がどれらがあるかを考慮する必要はなく、データがどの程度デジタルプラットフォームの生産活動に入ることができるかを考慮するだけでよいと指摘した。データ階層分類授権メカニズムはデータがデジタル経済の生産活動に急速に入ることを推進することができ、プラットフォーム企業のデータの取得と利用を合理的かつ合法的にするだけでなく、データの取引コストを減らすことができる。

シンポジウムでは、長江学者で清華大学電子工学部の李勇副教授が、データ市場システムを3つの段階や市場に分けるのは非常に良いと述べ、技術的な案と脈々と受け継がれている。データの変現やデータ産業化を実現するには,実際には非常に困難であるため,元のデータをデータ要素に変え,データ要素をデータ製品に変えることは,工学的に解結合の方程式である.

李教授は、「私が関心を持っているのは、データ等級分類制度が確立された後、経済学に新たな問題をもたらすことだ。技術的には良いが、技術的にできるかどうかは、経済的要因、社会的要因にかかっている」と指摘した。

経済コストの問題について、戎珂氏は、データ分類格付け授権制度がデータ権の問題を源から解決するのに役立つと説明した。データの所有権が不明な場合、後続の取引コストがますます大きくなります。「現在、ソースで問題を解決するのが面倒で、いっそ解決しないと思っている人もいるかもしれませんが、ソースで解決しないと、後で「原罪」の問題が発生します。だから、最初のデータ・ソース・ベースの権限は非常に重要だと思います。」戎珂が表す。

徐翔氏は、報告書が提出した3級市場概念は、中国の現在のデジタル経済に必要なデータを基本的に概括し、特色のあるデジタル経済理論の革新であると考えている。

戎珂の分析によると、「将来のデータ市場の全体的な傾向は、第3レベルの市場への進化であると考えられています。将来的には、より多くのデータ製品の取引が発生する可能性があり、同時により多くのデータサービスの取引が発生する可能性があります。しかし、データの0-1は、授権プロセスであり、永遠に存在し、その収集方法は非常に分散しており、各シーンで発生する可能性があります。しかし、最後にどのように使用するかは、プラットフォーム上のいくつかのモデルは、場内や場外のモデルを主とし、さらに探求する必要があります。」

越境協力については、呉沈括氏がルールの設定を通じて主体、特に私有主体の経済負担、行政負担をどのように下げるかが考慮すべき問題だと述べた。中国の需要に適応することを強調し、特にデジタル中国の戦略的需要の下でデータ要素市場を構築する際、便利さ、安全などの考慮に基づいて、各方面が認めることができる規則を設計し、さらにトップレベルの制度体系設計を形成する。「EUも米国も、次の段階の国際協力ゲームの制高点はデータ要素市場であり、一連のルール、制度の試みは共通性を持っていることを認識している」。

データエコガバナンスはコストを考慮し、社会福祉の最大化を実現する

報告書は、データ生態管理とは、データ生態をめぐって、各データ生態パートナーの役割を明確にし、各種類のデータ生態パートナーが共同でデータの協同管理、多段階管理を実現することを要求し、個人のプライバシーとデータの安全を保護した上で、データ価値をよりよく発揮し、デジタル経済とデジタル社会の高品質な発展を促進することを要求している。

報告書によると、データのプライバシーを保護する条件の下でデータ要素の経済価値を十分に活性化し、データ生態管理能力を高めるには、中国外のインターネット企業がAI、ビッグデータなどの技術優位性を利用して、データ管理を積極的に模索し、実践している。アマゾンMacieは機械学習を通じて、AWSに保存された機密データを自動的に発見、分類し、ユーザーデータの安全を保護する。Googleはパスワード検査器Password Checkupを発売し、ユーザーがウェブサイトに入力したユーザー名とパスワードが盗用されたかどうかを検出するのを支援した。アリババはDataWorksの全リンクデータ管理製品システムを発表し、アリババのデータ管理能力を対外的に付与した。ジッタ音は収集を最小化する原則を堅持し、データ収集分析をより正確に行い、全方向量子化リコール方法を採用し、ユーザーのプライバシー漏洩問題を回避する。

国家行政学院経済学部の許正中副主任教授は、データ生態管理の概念を認め、データは生産要素から産業、国家管理まで、生態系であると述べた。データ産業共同体、汎コミュニティガバナンスネットワーク、および全リンクデータガバナンスはデータ生態ガバナンスにおける重要な問題である。

報告書は、より広義の視点から見ると、データ生態管理を強化することは、社会管理におけるデータの重要な役割を発揮し、社会管理の現代化、デジタル化、インテリジェント化を促進するのに有利であると考えている。報告書は短いビデオ分野の実証研究に基づいて、デジタル共治は工業二酸化硫黄と工業粉塵の排出量に対して著しい抑制作用があることを発見し、その中で、政府とプラットフォームの努力は特に重要で、政府の努力強度は1%上昇するごとに、工業二酸化硫黄と工業粉塵の排出量はそれぞれ0.5219%と0.5505%減少し、プラットフォームの努力強度は1%上昇するごとに、工業二酸化硫黄と工業粉塵の排出量はそれぞれ0.2494%と0.2208%減少し、政府とインターネットプラットフォームが構築したデジタル共治が経済グリーン発展の促進に著しい促進作用を持っていることを示している。

謝丹夏氏は、彼が創始した「データ革新の内生成長理論」を紹介した。データには「不純物」があり、プライバシーリスクなどの福祉損失をもたらす可能性があるため、データの中の不利なものを取り除く必要があります。彼は「データから知識への漂白凝練」プロセスと呼ばれています。つまり、データが革新され、再利用可能な「純粋」な知識を生み出すプロセスです。また、データに関わるプライバシーコンテンツは、プライバシーコンピューティング技術等により効率的に制御することもできる。「我々はどのように「不純物」の影響を回避し、価値のある部分だけを取引するかは、実際にはより基礎的で科学的な角度からデータ要素の本質を検討し、将来の立法にも役立つだろう」。

李勇氏は人工知能とデータ管理の関係を分析する際、データ管理と人工知能は双方向循環の問題であり、「人工知能技術の応用には新しいデータ生態管理問題が伴っているが、データがなければ、人工知能の応用価値はそれほど大きくない」と述べた。彼は、人工知能技術の観点から見ると、データ管理問題を解決する方法は、需要の満足と応用品質を確保する前提の下でできるだけデータを少なくし、できるだけ分布式にデータを使うか、データを使わないことだと考えている。

首都経済貿易大学工商管理学院の施新偉助教授は、データ生態管理には参加者を考慮する必要があり、現在のデータ生態管理はデータそのものに焦点を当てていることが多く、データの生産者、消費者、第三者などもデータ生態管理に組み入れるべきだと提案した。

清華大学公共管理学院教授で清華大学人工知能国際管理研究院の梁正副院長は、権属の定義にしても、定価、取引を含むプロセス全体の設計にしても、データ生態管理が最終的に実現しなければならないのは社会福祉の最大化だと考えている。

梁正評価報告書によると、バイトの火山エンジンを動かす連邦学習プラットフォームFedlearnerは多種類の連邦学習モデルをサポートし、分布式機械学習、同態暗号化、多方面安全計算などの技術を融合させ、データの「利用可能かどうか」を実現し、データのプライバシー保護問題を解決し、電子商取引、金融、教育などの業界の多くのシーンで実際に応用している。著しい順方向効果を得たのは、人工知能技術をデータ生態管理に応用する典型的なケースである。「経済学の視点から見ると、データ公共ガバナンスモデルの変化は、各利益関係者の間でどのような相互関係を生み出し、ガバナンス業績と産業発展にどのような影響を及ぼすかは、私たちの公共管理学者が特に関心を持っている問題だ」と強調した。

施新偉氏は、データ生態管理はスタート段階で開放的な国際化とグローバル化に立脚し、中国主導のコンピューティング産業生態の普及と同時に国際化、グローバル化の管理を行うべきだと述べた。

社会福祉の最大化から出発し、報告は最後に、分類等級データ授権体系、および全産業チェーンの一環、異なるシーンのデータ取引市場に対して、相応の分類等級データ要素監督管理体系を確立し、各級各種類のデータ取引を規範化することを提案した。まず、データ要素の全産業チェーン分類等級識別システムを確立し、データ要素のカテゴリレベルが常に明確で、動的に遡及できるようにする。次に、データ要素の分類・等級付けシステムの実行を積極的に推進し、各方面の主体の力を発揮し、相応の監督管理主体と要求を明確にし、共治・共同建設、成果共有の初志を達成する。企業は収集したデータに対して分類等級体系を確立する主体責任を負わなければならない。関連業界協会と業界組織は業界基準の制定を通じて、第三者認証システムを発展させ、データ要素の分類・等級付けを推進する。各級政府及び主管部門はデータ要素の分類・等級付けの督促と実行を負担しなければならない。最後に、カテゴリレベルが高ければ高いほど、監督管理措置が厳格になるという原則に基づき、各種各級データ要素の監督管理措置を完備する。公開データ及び授権の程度が低い緩和条件の下で商用データに対して、自主経営、共有を奨励する原則を取らなければならない。例えば、ユーザーが公開して使用するニックネーム、顔など公開した一般個人情報、企業連絡情報/製品価格表、政務公開情報など、プラットフォーム、公共と商業分野にまたがって共有することを奨励しなければならない。社会全体のデータ要素資源の流通と価値の倍増を促進する。

- Advertisment -