令和にmtgがおかしくなったのは「ちゃんとテストプレイしてるから」説

 昨日スタンダード(及びヒストリック)での創案の火と裏切りの工作員の禁止と相棒ルールの変更が発表されました。

 

2020年6月1日 禁止制限告知|読み物|マジック:ザ・ギャザリング 日本公式ウェブサイト

 

 スタンダードで禁止カードが出てしまうというとつい「よっぽどひどい環境だったのかな?」と思ってしまいますが、個人的にはイコリア環境はそう悲惨なものではなく、活躍するデッキの多様性という点ではむしろいい環境だったくらいに思っています。

 環境初期はラクドスルールスサクリファイスとジェスカイケルーガファイアーズが目立つ活躍をしたものの、その後ヨーリオンデッキがシェアを伸ばしスルタイヨーリオンコントロールなんかも試される中バントヨーリオンコントロールがトップメタに。相棒を使うデッキが活躍する中ティムール再生は非相棒デッキながらメタゲームに食い込む活躍を見せ、新たなアーキタイプとしてボロスサイクリングが台頭し、メタゲームの隙間を突くかのようにイコリア成分のほぼないティムール出来事が結果を残したりも。そして新たなコンセプトのヨーリオンデッキであるジェスカイルーカファイアーズが広まるとこのデッキがトップメタの地位を奪い、ついには昨日の禁止改訂に至りました。

 このように環境初期に強かったデッキがその後もずっと勝ち続けるということはなく、めまぐるしくメタゲームが変化し様々なデッキが試されたイコリア環境のスタンダードは決して悲惨な環境とは言えないでしょう。上で名前を挙げなかったデッキとしてまだ青白コントロールやオボシュ赤単やジャンド城塞などもあり、環境の多様性はかなり高かったと思います。

 

 とはいえ、多くのマジックプレイヤーが灯争大戦以降の令和のmtgはなんだかおかしくなってしまったと思っていること、そしてそれに不満を抱いているということは無視できない事実です。

 これまでは新セットのカードがモダンやレガシーに与える影響というのは限定的でしたが、最近では新セットが出るたびに下環境も大きく変化するほどにカードパワーが高まっています。それこそ変化が少なく気に入ったデッキを長く使い続けられることに下環境の魅力を見出すタイプの人からすると付いていけなくなるほどに。

 当然にそのパワーインフレの影響は下環境だけでなくスタンダードにも影響し、現在ではスタンダードで禁止されているカードは6枚に及びます。イクサラン、ドミナリア、ラヴニカのギルドと献身くらいの令和の前の一年半では禁止されたカードは後に解禁されたフェロキドンくんしか存在しません。

 

 さて、現在のmtgに不満を抱く人が多数いるため、禁止カードが出て相棒ルールも変更になるとネット上では罵倒の言葉が飛び交っています。「ちゃんとテストプレイしてないだろ!」「開発スタッフ無能すぎ!」という具合に。

 

 しかし、灯争大戦以降mtgがおかしくなったのはテストプレイをしていないからでも開発スタッフに無能しかいないからでもないでしょう。

 

 WotCは以前スタンダードの人気がひどく低くなってしまったことを受けプレイデザインチームを発足させました。集められたのはメリッサデトラを始めとしたトーナメントでの実績のあるマジックのスキルの高い人ばかりです。プレイデザインチームが完全に機能するようになったのは灯争大戦からだと公式で明かされており、これはmtgがおかしくなったのとタイミングが同じなのでプレイデザインチームの発足こそが直接的に現在の過剰なインフレの原因であることはまず間違いないでしょう。

 

 である以上、テストプレイは熱心に行われているはずですし、無能しかいないせいでバランスが壊れたという解釈には無理があるように思います。プレイデザインチームのスタッフのマジックのスキルはかつてのデベロップチームのそれよりもかなり高いはずです。

 

 ではなぜ現状があるのか。自分の想像ではおそらく原因は「ちゃんとテストプレイしているから」です。WotC内の本当の事情など知るわけがないのであくまで勝手な想像に過ぎませんが、解説します。

 

 新セットがリリースされ私たちがMTGAのランクマでスタンダードを遊ぶときのことを想像してみてください。私たちは興味のあるコンセプトでデッキを組み、対戦します。デッキが弱いと感じたら構成をいじってみたり、そもそも違うデッキに乗り換えたりしてより高い勝率を目指します。相手にしたデッキが強いと感じたらそれを目コピして回してみたりもするでしょう。自分のデッキに自信が持てたらSNS上に投下しいいねを稼ぎ、別の人はそれをコピーして回します。それが本当に強かったら使い続けるし、弱かったら回すのをやめます。世界中の人たちがそうやって遊ぶ中で集合知は蓄積していき、強いデッキはあっという間に広まります。

 

 一方で社内の10人前後のチーム内でテストプレイするときのことを想像してみてください。組まれるデッキは各メンバーの個性次第で、ランクマやイベントの勝率で淘汰されたり広まったりすることはありません。本当はものすごく強いデッキがあったとしても、チーム内でそれが発見されるかは運次第です。強いデッキが流行し頻繁に対戦相手として現れるということは起きません。更にカードの内容は日々変化していきます。

 

 要するに、私たちがMTGA等で遊ぶのと内部でテストプレイするのとでは前提となる環境が全く異なるわけですね。そのため、テストプレイは必ず不十分なものでしかありえません。

 

 これは構造的な問題であり、メンバーの能力の問題ではありません。仮に現在のプレイデザインチームのメンバーを全員解雇し、現在MPLで活躍するプロプレイヤーを代わりに雇ったとしても同じことです。

 

 例えばPTパリ2011ではベンスタークがカウブレードを使用して優勝したわけですが、その優勝リストですらその後のカウブレードのリストに比べると粗削りです。同PTではトップ8にカウブレードが4人入賞しているのですが、そのうちの日本人2人を見てみると中田直樹は石鍛冶の神秘家を2枚しか採用しておらず、石村信太朗は戦隊の鷹をサイドボードに落としています。今から振り返ると信じがたい選択に思えますが、しかしそれでもカウブレードを選択したというだけで参加者の中でエッジを出せていたんですね。なにしろカウブレードを選択しないというのは石鍛冶を2枚しか入れないことや鷹をメインボードに採用しないことよりも遥かに大きな間違いだったわけですから。

 別の例も挙げましょう。テーロス環境のトップメタデッキといえばもちろん黒単信心ですね。ではPTテーロスで黒単信心を使用したプレイヤーは何人でしょうか? 答えはわずか3人です。

 

 当時のPTは確か新セットの発売の2週間後か3週間後に開催されており、その間にスタンダードのGPもないのでMOのDEや各地の草の根トーナメントの結果くらいしか参考にできる情報はなく、チーム内での調整に頼ってデッキを作り上げるしかありませんでした。そのような状況だとプロプレイヤーであっても後にトップメタとして君臨することになるデッキに比べるとかなり弱いものしか用意できないというのが現実としてあるわけですね。

 である以上、MOのDEや草の根トーナメントの結果を参考にすることすらできず、カードのコストや効果も一定でない内部テストプレイの質というのはどうしても限界があるのが当然でしょう。

 

 おそらくプレイデザイン発足後のWotCの最大のミスはこの限界について認識が甘かったことです。優秀なスタッフを集めた! 彼らに熱心にテストプレイをさせた! そうなるとどうしてもそのテストプレイの結果を信用したくなってしまいます。これまでなら避けていたような危険なデザインのカードもテストプレイの結果問題なさそうならGOサインを出してしまう。

 

 でも、やっぱりリリース後に我々が遊ぶ環境と内部テストプレイ環境は全然別物なんです。

 

 物事を判断する際に利用するデータは、きちんと判断材料として適切なものである必要があります。

 例えば地球温暖化について知りたいと思って一年間毎日近所の学校の百葉箱をチェックし続ける人がいたとします。でもそれでわかるのはその地域の一年間の天気や季節の移り変わりであって、地球温暖化のことは何もわからないですよね。

 世論調査をしたいと思ってツイッターでアンケートを取る人がいたとします。それでわかるのはその人のフォロワーやそのツイートをRT等で目にした人の中の、わざわざツイッターアンケートに答えるタイプの人という更に狭いカテゴリの人たちの考えであって、そもそもツイッター自体見ない人も含めた全国の人々の意見がどうなのかはわかりません。

 

 テストプレイでこのカードを使ったデッキの勝率がすごく高かったとか、そうでもなかったとかの情報も同じことです。その情報から言えるのはどうも勝率の高いデッキは上手く組めたっぽく、そうでもないデッキは上手く組めなかったっぽいということであって、実際のリリース後の環境がどうなるのかとは大きな距離があります。判断材料として全く適切ではないんです。

 

 にも関わらず優秀なスタッフが熱心に行ったテストプレイだからといってその結果を判断材料として大きく信用してしまったなら、判断材料として不適切なものを判断材料にしてしまっているわけで、そりゃあ当然メチャクチャにもなります。

 

 本来は「3マナのPWは強すぎになりやすい。ボード触れるならなおさら」とか「デッキを5枚も掘れる軽いカードが汎用的に使えるとヤバい。0コストとかマジヤバイ」というような過去の蓄積から得た知見をベースに、それだけでは判断しきれないところをテストプレイで得た知見で補うのが良いはずです。テストプレイで得た知見に全幅の信頼を置いて過去の蓄積からの知見を軽視しては主従の逆転です。

 

 昨日の禁止改訂の公式の文章にて、創案の火について「今後新しい高コストカードが出るたびにどんどんヤバくなってくからカードデザインに制限かけるわこのカード」という旨のことが書かれていて、それに対してツイッターでは「そんなん見ればわかるだろ」という反応がされていたんですが、これはいかにもネットっぽい煽りでありながら意外に本質を突いたものなのではないかと思います。テストに頼らずに見ればわかることは見ただけで判断すべきです。下手にテストしてしまうとカードは強いけど組んだデッキは弱かったとか、相手デッキとの相性が悪かったとか、相手デッキにそれ以上の壊れカードが入っていたとか、たまたまよく事故ったとか、そういったことによりバイアスがかかって正しく判断できなくなるリスクが高まります。

 

 もちろんこの「テストプレイに頼りすぎたのがバランスがおかしくなった原因ではないか」というのは単なる憶測なんですが、一応この説を補強する材料を提示しておきます。

 

Mファイル『基本セット2020』編・赤、緑、多色、土地、その他|読み物|マジック:ザ・ギャザリング 日本公式ウェブサイト

 

  この記事の中で夏の帳についてこのように書かれています。

 

 わたしたちは多分、《夏の帳》のデザインにこのサイクルの残り全部のカードを合わせたよりも時間をかけています。

 

 しかしそれだけの時間をかけた夏の帳はスタンダードで禁止されてしまいました。夏の帳のカードパワーが高すぎるものになってしまった原因は明らかにテストプレイの不足ではありません。むしろ、たくさんテストする中で客観的視点を失い「見ればわかるだろ」で判断できなくなってしまったのが見て取れます。

 

 

 最後に。

 今後のマジックが良くなるのか、ですが、自分はこれに対してかなり楽観的です。

 

 以前、確か霊気紛争かアモンケットの頃に以下のようなブログ記事を書きました。

 

問題はスタンダードのブロック構築化である

 

 スタンダードの問題について指摘する内容ですが、現在ではここでした指摘は全く当たらなくなっています。

 当時も今も問題のある状況なら同じなのでは? と思うかもしれませんが全然違うんです。

 この記事では「低レアリティの基本カードのデフレのせいで一部の目玉カードの支配力が過剰になり多様性が失われているのでは?」ということを書いたんですが、現在のマジックにそのような問題はありません。

 この記事を書いた後、稲妻の一撃、選択、呪文貫き、強迫、ラノワールのエルフ、成長のらせんなど強力な低レアリティの基本カードが多くスタンダードセットに収録されました。イコリア環境についても、この記事の冒頭で述べたように多種多様なデッキタイプが存在し、やはりこの記事で指摘しているような問題は存在しません。

 

プレイデザインの教訓|読み物|マジック:ザ・ギャザリング 日本公式ウェブサイト

 

 また、この記事ではこのように書かれています。

 

 スタンダード内のパワー・レベルが低いということは、このフォーマットがパワー・レベルを間違ったカードにより敏感であるということであり、この事実によってこれらのスタンダード・フォーマットはひどく歪んでいました。《密輸人の回転翼機》や《ゼンディカーの同盟者、ギデオン》などのカードはそのフォーマット内のカードが強ければ起きないような方法で支配的でした。

 

 自分の主張は低レアリティの基本カードのパワーを上げるべきだということであって全体をインフレさせるべきだというものではないので若干の違いはあるんですが、だいたい同じことを言っています。

 

 マジックは僕が指摘していたような問題を解決しました。ただ、代わりに、逆方向にやりすぎてしまっただけです。

 マローがよくコラムに書いているように、マジックは変化するゲームです。今はまだ令和の失敗のフィードバックを反映できていない状況なのでマジックは不安定に見えますが、現在のフィードバックがセットに反映される頃にはきっと良くなるはずだと信じています。