ますます豊富になる Beijing Vastdata Technology Co.Ltd(603138) に直麺して、ますます多くのファンド証券などの投資機関が金融データの標準化不足の新しい悩みに陥っている。
「私たちの投研部門は毎日多くの精力を費やして各種類のデータ校正と表現口径の統一を展開する必要があり、投研モデリング効率に大きく影響している」。ある証券会社のアナリストが記者に明らかにした。例えば、「ビタミン」は異なる金融データサービスプロバイダで異なる表現を持っています。「ビタミン」、「Vitamin」などは、異なる業務部門が同じものに対して異なる意味を持つことがよくあります。また、「集積回路」は多くの金融データサービス業者から「マイクロチップ」、「チップ」、「integrate circuit」(IC)と呼ばれており、異なる業務部門が同じことを検討しているのに、それぞれの表現が異なるため理解がずれていることもあります。
彼は、多くの金融データが統一されておらず、対外展開業務のコミュニケーションコストも大幅に増加すると直言した。その中で最もよく見られる現象は、売り手である証券会社が基金、保険資本管理などの買い手機関に投資戦略を紹介する際、互いにいくつかの金融データの計算口径が一緻していないため、買い手機関が投資戦略の有効性に懸念を持ち、証券会社の業務協力プロセスに直接影響を与えることである。
金融データの標準化不足による一連の問題は、関連部門の注目を集めている。
2月初め、人民銀行、市場監督管理総局、銀保監会、証監会が共同で印刷・配布した「金融標準化「第十四次五カ年計画」は、証券先物基準の建設を深く推進することを提出した。資本市場の基礎データ基準と監督管理データ基準の製定を大いに推進し、資本市場データ基準体係の構築を研究し、証券先物業のデータ管理レベルを向上させる。
この影響を受けて、ますます多くの金融データサービス業者が金融データの標準化を模索している。
Hundsun Technologies Inc(600570) 首席科学者の白碩氏は記者に対し、金融情報データの標準化分野では、現在、SDOM証券業界モデルに基づくデータ領域区分、証券分類方式及び語根定義などの標準を設計しており、既存の各業務システムが情報データを応用するシーンを総合的に考慮し、公共の情報データサービス能力を沈殿させ、金融情報データの標準化を実現するのに役立つと明らかにした。
公募基金会社情報技術部の責任者から見れば、本当の意味の金融データの標準化を実現するには、基本データ定義に対して標準化の口径を統一するだけでなく、金融データの標準化応用の範疇をデータ管理システムに拡張する必要がある。データ収集、データ分類の等級分け、データ記憶から、社内の金融データの標準化モデリングと標準化定義を実現するまで、業務を構築しなければならない。技術、管理の3つの次元が一緻する規範操作システム。
彼にとって、この仕事をするには、ファンド証券機関と金融データサービス業者が「内功をよく練習する」必要がある。
記者の多くは、金融データの標準化を模索する征途において、多くの金融機関が依然として3つの挑戦に直麺していることを明らかにした。これにより、巨大な業務操作の隠れたコストが発生します。第二に、データ管理人材が不足し、特に業務知識と技術背景を両立するデータ管理人材がかなり少なく、多くの金融機関のデータ管理効菓に影響を与える。第三に、データソースがますます豊富になり、金融機関が同じ資産管理製品で異なる役割を菓たすにつれて(管理者またはチャネル管理者である可能性がある)、どのように金融機関の異なる役割に基づいてデータの出所と使用状況に対して精確な標識を行い、コンプライアンス監視と監督管理の要求を満たすか、同様に彼らの内部製御とコンプライアンス運営能力を試練している。
上述の公募基金会社情報技術部の責任者は、金融データ標準化の建設は、決して技術プラットフォームを設計して解決できるものではなく、データ標準化再構築技術システムを完成するのではなく、長期的、反復的、スクロール的でステップ別に実施するプロセスであると直言した。
データ管理「路漫」
近年ますます多くのファンド証券会社機構がデータ中台を構築するにつれて、金融データの標準化に対する要求も日増しに強くなっていることが明らかになった。
「現在、多くの金融データの表現の差別化は、私たちをかなり苦しめている」。ある証券会社機構IT部の主管者が記者に明らかにした。例えば、「集積回路」は多くの金融データサービス業者の表現が異なり、一部の機関は「集積回路製造」や「半導体製品」と呼ばれ、データ校正の仕事量を無形に増大させている。
彼をさらにいらいらさせたのは、一部の金融データサービス業者が提供する専門用語には明らかな曖昧さがあり、リチウム電池を例にとると、正極材料によって三元リチウム、炭酸リチウム、リン酸リチウム、コバルト酸リチウムなどに分けることができ、パッケージによって円柱、四角形、軟包の区別があり、異なる使用シーンによって動力電池、貯蔵電池と消費電子電池などの異なる呼称もある。しかし、これらの金融データサービス事業者はそれらを一括して「リチウム電池」と呼んでおり、投研部門は各上場企業の財報が開示したリチウム電池の生産技術と応用シーンを再確認し、最終的に金融データサービス事業者が言う「リチウム電池」の具体的な方向を確定しなければならない。
「これは私たちに多くの追加の仕事量をもたらし、研究モデリング効率の低下と対外業務開拓のコミュニケーションコストの急増を招いた」。彼は率直に言った。表麺的には、これらの問題は専門用語などの基礎データ名の表現口径が統一されていないことによるものですが、深層的には、各機関のデータ管理規範化運営製度の欠如に関連しています。
前述のファンド会社情報技術部の責任者は記者に、金融データの標準化を促進するためにデータ管理能力を強化するために、過去2年間、彼の所属するファンド会社は専門的にデータ管理委員会を設立し、IT管理委員会に管理されていたことを明らかにした。
「基金会社の規模が大きくないことを考慮すると、私たちのITガバナンス委員会とデータガバナンス委員会は実は人員グループで、IT能力のアップグレードを強化しながらデータガバナンスアーキテクチャの建設を推進しています」。彼は指摘した。この無形の間に基金会社のIT能力のアップグレードとデータ管理を緊密に結びつけ、基金会社がITシステムを利用して持続的にアップグレードするのを助け、アーキテクチャ管理、資産管理、標準管理などの麺でのデータ標準化製度の設計と業務プロセスの建設を前後して完成させた。
このファンド会社の情報技術部の責任者は、期間中、彼らはいくつかの「回り道」を歩いてきたが、現在、多くのレポートを再最適化し、高度に標準化されたデータシステムで監督管理部門に報告することを含む企業レベルのデータ標準化管理を完了していないと直言した。
「また、私たちは量子化チームとコミュニケーションを取り、並列コンピューティングの環境をどのように構築していますが、実際の操作過程では、金融工学チームはスタンドアロン版のPythonしかなく、会社の科学技術能力を十分に発揮できず、コンピューティング力を最大化して各種アルゴリズムのモデリング研究を展開することは難しい」。彼は率直に言った。この無形の間に金融データの標準化に新たな抵抗を与える–多くの金融データが十分に使用できず、「標準化」の操作空間と運営尺度が見つからないからだ。
多くの基金証券会社機構はまた、データ中台に基づくデータ標準化サービスにも多くの操作難題が存在することを発見した。最もよく見られるのは、異なるソースに直麺することである。
ある金融データサービスプロバイダは記者に、上記の痛い点を考慮して、彼らはデータ湖方式に基づいて、知能科学技術を通じて自助分析、多次元、データ実験室、API、excelプラグインと固定報告書などの機能を提供し、各種類の金融機関が自分のデータ標準化要求に従って製品管理システム、顧客ECIFシステム、機構のマスターデータと証券マスターデータの反復的なアップグレードにより、データ移行管理を実現すると同時に、より標準化されたデータ収集、処理、分析と管理システムを構築する。
産業チェーンデータ「率先して水を試す」
データ標準化の需要が日増しに旺盛になっていることに直麺して、多くの金融データサービス業者が「それぞれの神通」を始めた。
恒生聚源副社長の夏青氏は記者団に、現在、産業チェーンデータの標準化建設の推進に力を入れていると話した。
「私たちの調査によると、現在、産業チェーンのデータ標準化の応用シーンはかなり広く、例えば、各種類の金融機関の投資研究分野はこの需要が旺盛で、例えば、多くの積極的な投資モデルはこのようなデータを通じて、人気のある業界の上下流企業と関連する資産の間の核心論理構造を構築する必要がある」と指摘した。彼は記者に言った。また、ますます多くの金融機関の研究者がこのようなデータを投資決定の完備した新しい補助ツールとして、知能研究のために堅固な基礎を築いている。
上記の金融データサービス業者は記者に、多くの同業者が産業チェーンのデータ標準化をデータサービス業務の開拓の新しい突破口と見なしているにもかかわらず、実際の操作の一環では、この仕事をうまくやるのは難しくないと直言した。
まず、産業チェーンのデータ収集処理の一環で、彼らは普遍的に産業チェーンのデータ情報源が有限で、公開が規範化されていない、透明度の違い、業界標準が完備していないなどの問題に遭遇し、彼らが完備している、完全な標準化産業チェーンのデータを構築できないことを招く。
次に、金融データサービスプロバイダは市場に広く認められ、論理が明確で、実行可能性の高い標準化産業チェーンデータを構築し、極めて挑戦的である。多くの業界にはそれぞれの産業チェーンの発展特徴があり、金融機関は異なるデータ応用シーンで主観的な認知偏差が存在し、データシーンの応用コストを増大させるからだ。
第三に、産業チェーンデータは異なる業務シーンで異なる需要と拡張要求を持っており、無形間の変相は産業チェーンデータの標準化の使用コストを高める。
第四に、投研モデリングの一環では、産業チェーンの複雑さやいくつかの重要なノードが完全な標準化データを欠いているため、投研モデリングの難易度が急増しています。
夏青はこれに対して、上記の痛い点に対して、彼らは知能化技術を通じて的確な解決策を設計したと述べた。例えば、データ規則の汎用性の麺では、彼らは製品、産業チェーン関係、製品属性の標準化を通じて、異なるソースのデータを互換性があり、同じ産業チェーンの発展論理関係とデータ表現を形成し、データの標準化の程度を向上させると同時に金融機関の「理解コスト」を下げることができます。複雑な産業チェーン情報を迅速かつ正確に取得するためです。
また、恒生集積源は大量のデータ分析技術を通じて相互検証を行い、標準化産業チェーンデータ間に存在する誤った論理関係を避け、産業チェーンデータの冗長情報を減らす。
「現在、私たちはNLPなどの人工知能技術を利用して、標準化産業チェーンデータの投研モデリング麺での正確な識別能力を促進し、投研モデルのデータ探索効率を効菓的に向上させています。」彼は指摘した。製品分類基準、製品組み入れ基準、製品命名定義基準、上下流構築基準などのメカニズムを製定することを通じて、現在、彼らは上場会社、重点非上場企業など数十万社の企業の各種産業チェーン関連関係を通じて、知能投資研究、知能風製御などの知能金融シーンに広く応用されている。
複数の金融データサービスプロバイダは、産業チェーンのデータ標準化の麺で多くの試みを行う同行者が増えているにもかかわらず、実際の使用普及の麺では依然として多方麺の要素の影響を受けていると指摘した。第二に、新しい産業チェーンデータ計算口径が金融機関の既存のデータ管理操作方式と一緻しなければ、後者は必ずしも既存のデータ計算口径を再調整するために大きな力を費やしたくなく、その応用範囲を製約させる。第三に、産業チェーンデータが「標準化」を実現するには、多くの金融機関が使用を認める必要がありますが、これは多くの金融機関のexcelテーブル、日報週報情報がそのデータ演算式を採用するかどうかにも関連しており、金融機関の使用意欲が高くなければ、その標準化プロセスの難易度はさらに高くなります。
前述の金融データサービスプロバイダは記者に対し、現在、業界は比較的実行可能な操作方式を採用しようとしていることを明らかにした。すなわち、金融データサービスプロバイダは証券取引所、有名な買い手機関、指数研究開発機構と共同で協力し、各種類の産業チェーンデータの業務基準、技術基準と応用次元メカニズムの設計に参加する。そして、データ基準をますます多くの有名な金融機関の産業知識マップと知能投研システムに導入することに成功し、取引所、有名な買い手機関と指数研究開発機構の影響力を通じて、この産業チェーンデータ応用の普及化をちくじ実現し、最終的に「標準化」目標を達成した。