2006年、英国帝国理工学部で博士号を取得した徐迈は自分の最初の3 G携帯電話を買った。その时、中国はまだ3 Gネットワークがなくて、徐迈は先に异国で体験してみたいと思って、しかしよく使うマルチメディア业务が3 Gネットワークで运行することができないことを発见して、使用体験と2 Gは基本的に异なっていないことを招いて、そこで彼は思い切って返品を选びました。
先日、北京航空宇宙大学の教授として第24回中国科学技術協会の優秀な青年成果転化賞を受賞した徐迈さんは、「当時の3 Gであれ、現在の5 Gであれ、情報インフラは『高速道路』のようなものだった。もしこの『高速道路』にそれにマッチする『車』がなければ、適切なメディアコンテンツがなければ、役に立たない。私とチームが行った感知に基づくビデオ符号化研究は、『高速道路』のために規格の適切な『車』を作ることだ」と話した。
20年余りの耕作を経て、5 Gマルチメディア分野で多くの研究成果を収めた「造車職人」は、科学技術日報の記者に自分の学術経験と研究成果を紹介した。
科学研究の探求がもたらす興奮感が好き
1999年、徐迈は北京航空宇宙大学に入学し、通信工学専攻を選んだ。「この専攻を選んだ理由は簡単だ。それはとても人気があるからだ。それに、私はもともと工科が好きだったので、この選択は理にかなっている」。彼は思い出した。
本科の学業を終えた後、徐迈は清華大学で修士号を取得した。修士課程を卒業する時、徐迈は人生の中で1つの重要な選択に直面します:会社に行って仕事をしますか、それとも科学研究をして引き続き博を読みますか?多くの卒業生と同じように、徐迈はすぐに決定することができず、清華大学の張林教授にも相談した。
張林さんは自分の経験から徐迈さんに「創造的な仕事に就きたいなら、ブログを読み続けるのが適当だ」と話した。
徐迈は科学研究の探求がもたらした興奮感が好きで、最終的に帝国理工学院に行って博士号を取得することにした。ロンドンでブログを読んでいた間、人工知能と機械視覚分野の専門家マリア・ピーターの指導を受けた。卒業後、徐迈は清華大学に戻って博士後科学研究に従事し、感知に基づくビデオ符号化技術分野で深く耕作し始めた。
この方向を選んだのは、徐迈がずっと堅持してきた原則に由来している。科学研究をするには国の重大な需要に直面しなければならない。「国家、社会が急いで解決しなければならない問題を解決することは、自然に成果を上げやすく、社会効果も大きい」。彼は言った。
自分の科学研究生涯を振り返ってみると、徐迈が最も感謝したい人は、彼に学術方向の指導を与えた指導者たちだ。また、徐迈は特に時代と社会が彼に与えたチャンスに感謝している。
アルゴリズムに人間の目が情報を処理する方法をシミュレートさせる
時間は2 G時代に戻った2003年。その時、ある技術専門家は、将来のある日、携帯電話でネット動画を見ることができると大胆に予言したことがある。当時、多くの人が奇想天外と見なしていた。しかし、ここ20年後の今日、短いビデオを見たり、ネットで生中継したりすることは日常生活の一部となっている。
「これが2 G時代から5 G時代にかけて最も直感的な変化だ」。徐教授は、「『道』が広がれば、道を走る『車』も違ってくる。最初は文字だったが、後にダウンロードできる動画があって、それからストリーミングメディアだったが、今は短い動画と生放送だった。インフラのアップグレードがメディア形態のリノベーションに可能性を提供し、『道』と『車』が並んでいる。これが通信技術の発展の基本脈絡だ」と説明した。
情報通信技術の進歩は、より速いネットワーク速度とより大きな帯域幅容量をもたらしたが、人々の需要も日増しに増加している。5 G時代、人々は超ハイビジョンビデオを視聴するだけでなく、多視点乃至パノラマ的な浸透体験も考え始めた。また、社会経済の発展に伴い、ネットワークにアクセスするユーザーも増えている。これらのニーズを前に、「車」の大きさや数をコントロールできなければ、5 Gのような広い「道」でも足りない。
徐迈とそのチームメンバーの主な仕事は、符号率を節約し、複雑さを低減し、知能計算方法でビデオのサイズを制御することである。同等の解像度のビデオ「ボリューム」を小さくするか、同等の「ボリューム」のビデオをより明確にします。
過去10年間の技術難関攻略の中で、徐迈はチームメンバーを率いてビデオコンピューティングと通信融合の新しいアーキテクチャを構築し、符号率が60%を超え、複雑度が50%を超えたことを節約した。彼はケースを結びつけて記者に紹介した。中規模のネットビデオ会社は、10%の符号率を節約すれば、千万元以上の帯域幅賃貸コストを節約することができ、また、よりスムーズで明確なビデオ体験も同社のためにより多くのユーザーを獲得することができる。
また,感覚に基づくビデオ符号化,すなわちアルゴリズムによる人間感知システムの模倣によるビデオ符号率の節約も,徐迈チームの研究方向の一つである。「現在の研究構想は2つあり、1つはアルゴリズムに人間の視覚処理システムをシミュレートさせ、人の注目点を予測することによって、注目点以外の情報を曖昧にし、それによってビデオ情報の負荷を減らすことである。2つはアルゴリズムに人類の先験知識をシミュレートさせ、すなわち構造情報を通じて画像全体を構築する能力である」。徐迈は紹介した。
「ヒト網膜上の神経節細胞の視覚伝達帯域幅は約8兆であることが明らかになった。人間の目はこのような少ない帯域幅で、このような豊富な情報を伝達することができ、これは人間の視覚処理システムのメカニズムとは切り離せない。アルゴリズムを人間に学び、人間の目の情報処理方式をシミュレートし、ビデオの情報負荷を大幅に低減することを目標としている」。徐迈はまとめた。
学生の育成と助けを重視
大学の先生として、徐迈は科学研究をするだけでなく、学生も連れて行かなければならない。徐迈は学生时代に多くの先生の助けを得たことがあるが、今は自分が教師になって、彼は学生の育成と助けを非常に重視している。
「学生がいい学校を申請してくれて、私が当初自分で申請したよりも楽しかった」。徐迈は感慨深げに言った。
自分が指導した多くの修士課程の大学院生を思い出すと、徐迈氏は、オックスフォード大学、帝国理工学部、チューリッヒ連邦理工学部などの国際名門校に進学し、中国科学院などの中国の科学研究機関や頭のインターネット会社で働いている人もいれば、多くの学生が科学研究所や商業会社の中堅人材になっていると話した。
徐迈は、自分がある学生を推薦して博を読んだことがあると回想している。その後、彼はこの学生の博士課程の指導者から感謝の手紙を受け取った。手紙の中でこの学生の科学研究と学習能力を肯定した。このことは徐迈に達成感を満たした。
「私一人の力は限られていて、チームを率いて仕事をするしかありません。しかし、もし私がいくつかの人を育成することができて、彼らに自分のチームを率いて国の戦略的需要、社会経済建設に奉仕させることができたら、私の仕事の意義を10倍、100倍に拡大することになります。」徐迈は言った。
現在、マルチメディア分野では、中国の技術開発、標準制定は世界のリードレベルにあるが、基礎理論の面では先進国とはまだ一定の差がある。徐迈氏は、この短板は中国が技術反復の中で受動的な位置にある可能性があると考えている。「将来の科学研究では、人材育成、基礎研究が重要だ。『情報高速道路』を円滑かつ先進的に維持するには、一代の科学研究者の給料と努力が必要だ」。彼は言った。