ディープラーニングを活用した先進的な梱包資材削減
Amazonの事業規模では、商品ごとに最適な梱包を選ぶことは困難です。幸いにも、機械学習のアプローチ、特にディープラーニング(深層学習)は、ビッグデータや非常に大きな規模の事象への適用性が高く、これらのツールの活用によって、Amazonでは出荷時の梱包材の重量を36%減らし、100万トン以上の梱包材を削減することに成功しました。

商品を出荷する際、商品ごとに適切な梱包を決めるのは容易ではありません特にAmazonでは、何億点にもおよぶ掲載商品は絶えず変化するため、すべての商品に適切な梱包を選ぶことは常に課題です。Amazonの規模では、手作業で商品一つひとつの梱包を選ぶことは不可能であり、また、一般的な梱包ルールや、普通のロジックでは解決できません。必要なのは、変化し続ける環境に臨機応変に対応できる最先端のスマートな自動化の仕組みです。

ディープラーニングを活用した先進的な梱包資材削減
応用科学者のPrasanth Meiyappan(右上)とリサーチ・サイエンス・マネージャーのMatthew Balesによる著書Reducing Amazon’s packaging waste using multimodal deep learning。2人のポジションペーパーは2021年版のthe 10 most read research papers on Amazon Science に収録されています。

幸いにも、機械学習アプローチ、特にディープラーニングは、ビッグデータや非常に規模の大きな事象への適用性が高く、自然言語処理とコンピュータビジョンという先進的な組み合わせは、Amazonの梱包材使用量のさらなる適正化を可能にしています。こうしたツールの利用により、Amazonでは過去6年間で、1回の発送あたりの梱包材の重量を36%減らすことに成功し、梱包箱20億個以上に相当する100万トン以上の梱包材削減につながりました。

リサーチ・サイエンス・マネージャーのマシュー・ベイルズ(Matthew Bales)は「私が2017年にAmazonに入社したとき、商品の物理的なテストは多数行っていましたが、何億もの商品を評価し、各商品に最適な梱包タイプを特定できる大規模なメカニズムはありませんでした」と話しています。物理学者でもあるベイルズは、Amazonのカスタマー・パッケージング・エクスペリエンスチームで機械学習の責任者を務めています。

「最初に行ったのは統計的な検証でしたが、これは基本的に、商品がすでに複数の梱包タイプで出荷されている場合にしか有用ではありません。私たちは、1商品ごとに、どの程度保護材を減らし、より軽量かつ持続可能性の高い梱包タイプにしても大丈夫かという点を予測できる機能を求めていました。予測機能を追求するには、機械学習が必要になります」とベイルズは説明しています。

お客様からのフィードバックの力

ある条件の商品が特定の種類の梱包タイプで安全に配送できるかどうかの予測を立てるため、ベイルズらは、主にお客様がAmazonで目にする商品名、説明、価格、梱包サイズなどのテキストベースのデータに基づいて、機械学習モデルを構築しました。

さまざまな種類の梱包材で配送された数百万の商品例と、特定の梱包材で配送された商品の破損例を基に、このモデルの訓練を実施しました。Amazonでは、梱包による商品の保護が十分でなかった場合、オンライン返品センターや商品レビューなどのフィードバックを通じてお客様から、リアルタイムに近い形でフィードバックを得ることができます。

「お客様からのフィードバックは非常に重要です」とベイルズは言います。「それがすべての統計的検証の原動力になります」

この機械学習モデルには、梱包タイプを決定する際に特定のキーワードが特に重要であることを学習させました。たとえば、「セラミック」、「食料品」、「マグカップ」、「ガラス」などのキーワードは、保護材付き封筒での発送が適切ではないことを示します。そうした商品には、箱での発送が適しています。封筒が適切な選択肢であることを示すキーワードは「マルチパック」や「バッグ」などです。これらは、商品がすでに何らかの梱包で保護されている可能性を示しています。

「Amazonストアのデータで訓練しているモデルの一部は、製品の内容や寸法についてとてもよく学習しています」とベイルズは話しています。

複数モデルのディープラーニングを用いたAmazonの梱包資材削減の取り組み

どのような商品であるかを自動的に知ることはとても重要なステップですが、それはまだ道のりの半分にしか達していません。同様に重要なのは、商品がAmazonのフルフィルメントセンター(物流拠点)に送られてくる前に、商品を納品するメーカーや販売事業者がどのような方法で梱包したかということです。たとえば、セラミックのマグカップは、透明なビニール袋に入っている場合もあれば、頑丈な箱に入っていることもあります。

製品の梱包について大規模な識別を行うには、コンピュータビジョンの導入が必要でした。Amazonに掲載されている商品画像が梱包方法を選択する際に参考にならないことは、機械学習チームではすでにわかっていました。たとえば、複数個入りのLED電球の説明は未梱包の電球1個の画像となっており、ワレモノであることが示唆されていますが、実際には、複数個入りのセットで販売する場合は、商品を納品するメーカーや販売事業者によって商品が破損しないよう適切に梱包されており、Amazonでさらに梱包を追加する必要はありません。そのため、この場合は納品された梱包状態のままで発送するのが最適な発送形態となります。

ベイルズが率いるチームは、Amazonが保有する画像データを利用してこの難題に取り組みました。フルフィルメントセンターに納品される商品の多くは、ベルトコンベアに載せられ、複数アングルから商品画像を撮影できるカメラが設置された特殊なコンピュータビジョン用トンネルを通過します。これらのトンネルは、商品の寸法を確認し、商品の欠陥を発見するなど、さまざまな目的に使用されます。

Amazonの応用科学者、プラサンス・メイヤッパン(Prasanth Meiyappan)は、自らのチームが手掛ける機械学習モデルの訓練範囲を、Amazonの商品詳細ページからのテキスト分類に加えて、標準化された商品画像にも拡大し、複数のモデルによるアプローチを行いました。

“わたしたちのモデルは、
梱包の外形を検出して形状を判断し、
ミシン目や商品を包む袋、
ガラス瓶を通過する光などを識別します”
プラサンス・メイヤッパン

メイヤッパンは「わたしたちのモデルは、梱包の外形を検出して形状を判断し、ミシン目や商品を包む袋、ガラス瓶を通過する光などを識別します」と説明しています。しかし、このモデルが画像から検出した内容をどのように判断したのかを人間が判別するには、一定の難しさが伴います。梱包の判断に際して、機械学習モデルが識別し、重視する商品の特徴は複雑になる傾向があるからです。

ベイルズは「重要なのは、機械学習モデルによる梱包の判断が経験的に正確なものだということです」と指摘します。

テキストデータと画像データの両方を取り入れることにより、テキストデータのみを使用した場合と比べて、機械学習モデルのパフォーマンスは30%ほど向上しています。ベイルズとメイヤッパンは、彼らの研究について記述したポジションペーパー(統一見解)を作成しました。

ベイルズは「特定の商品に最適な梱包タイプをモデルが確信している場合は、その梱包タイプに対して自動認証を行うようにしています。モデルが確信を持てない場合、人間が確認できるよう、商品および梱包にフラグを立てます」と述べています。この技術は現在、北米、欧州、日本の製品ラインへの適用を段階的に進めており、梱包材使用量の自動的な削減が進んでいます。

「これは梱包材使用量の削減、お客様の満足度向上、コスト削減の3つのウィン(triple win)です」とベイルズは言います。

バランスの取れた訓練

しかし、このトリプルウィンを達成するためには、機械学習領域で頻繁に遭遇する「種類のアンバランス」という厄介な問題に取り組む必要がありました。つまりその問題とは、機械学習モデルに効果的な学習をさせるには、成功例と同程度に多くの失敗例を与え、両者を効果的に区別できるようにするのが理想的であるということです。

このモデルの訓練に使用したデータには、何百万もの商品と梱包の組み合わせの例が含まれていましたが、梱包の種類によっては、その中の商品に何らかの形で適していないことが判明した梱包の例が1%程度しかありませんでした。

「機械学習を導入する前、Amazonでは一部の商品を一時期、封筒や保護材付きの袋に入れて出荷していました」「そのため、保護材付きの袋に適していた例は豊富にありましたが、適していない例はそれほどありませんでした。機械学習モデルでは、こうした圧倒的なアンバランスには問題があります」とベイルズは語っています。

“梱包に関連する機械学習の文献は
非常にわずかしかありません。
梱包分野では、
我々が扱っているようなデータセットを
取り上げる人はあまり多くありません”
プラサンス・メイヤッパン

メイヤッパンは「梱包に関連する機械学習の文献は非常にわずかしかありません」と話します。「梱包分野では、わたしたちが扱っているようなデータセットを取り上げる人はあまり多くありません。ある技術がデータセットの不均衡への対処にどの程度有効かは、個々のドメインとデータセットの両方に準拠します」

このように、種類のアンバランス問題に対する同チームのアプローチは、主に実験的なものでした。4つのデータと2つのアルゴリズムをそれぞれベースとしたもの、計6つのアプローチを適用した結果、最も効果的なアプローチにおいては、モデルの精度が大幅に向上しました。それは「無作為抽出による二相学習」と呼ばれるデータベースのアプローチで、訓練の第1段階では少数派の種類に、第2段階では全データに焦点を当てます。ベイルズは「わたしたちが執筆したポジションペーパーでは、この知識を機械学習コミュニティと共有しています。同じような問題に遭遇した人が、自身の問題領域でもこのアプローチが有効かどうか、自ら試してみることができるようにするためです」と語っています。

今後について

チームは、Amazonのすべてのお客様の言語を理解できるようモデルを訓練しつつ、各国の受注から梱包や発送の特徴を組み込んで、このツールの利用を積極的に拡大していきたいと語っています。

Amazonの科学者たちが、機械学習を活用して梱包材使用量を削減する方法を研究する一方で、AmazonはECのサプライチェーン全体で梱包資材を削減する取り組みも行っています。商品の保護を損なうことなく、梱包体積と梱包資材を節約できる最適なEコマース向け梱包を自社開発できるよう、商品をAmazonに提供いただく企業へのインセンティブを増やしていることもその一例です。

Amazonの「シップメント・ゼロ(Shipment Zero)」のゴールは、2030年までに全配送の50%を炭素ゼロ化(二酸化炭素排出量の実質ゼロ化)することです。それは、梱包という観点では、更なる梱包を追加しない、またはカーボンニュートラルな梱包で商品を出荷するということを意味します。これは、パリ協定の目標である2050年よりも10年早く、2040年までに炭素ゼロを達成することを約束するThe Climate Pledge(気候変動対策に関する誓約)に対するAmazonによる取り組みの一環です。

Amazonは、お客様と地球のために、持続可能なビジネスの構築に取り組んでいます。Amazonの目標、戦略、方針については、「Amazonサステナビリティへの取り組み」で詳しくご紹介しています。

*この記事は2022年1月4日に米国版Amazon Scienceで発表された記事を日本語に翻訳したものです。

そのほかの記事を読む