可能です。しかも確実に信頼できないノードがわかっているという条件は、トラストランク(TrustRank)やアンチトラストランク(Anti-TrustRank)の発想と非常に相性が良いです。
以下、理論的にどう扱えるかを、X(旧Twitter)のような拡散ネットワークを想定して論理的に説明します。
この情報だけで、信用度の低い可能性が高いノード(疑似スパム)は推定可能。
しかし、信用できるノードは状況次第で推定可能だったり不可能だったりする。
悪ノードの集合がわかるだけで、そこからの影響を逆流追跡すれば、怪しいノード集合を特定できる。
悪ノードに汚染されているかどうかは決められるが良ノードであるかどうかは追加の前提がないと決まらない。
グーグルのTrustRankは良ノード集合をシードにして信用スコアを伝播させるが、Anti-TrustRank は逆で、悪いノードから不信スコアを伝播させる。
Xの例だと
悪ノード → A → B → C
C と Z は悪ノードから距離が遠いが、もしそれ以外のネットワーク構造が不明なら、CやZが信用できるとは論理的に確定できない。
理由は簡単で、善を証明できるには良ノードのシードが必要で、悪だけでは悪の汚染のみがわかる。
以下の前提を1つでも置けば、信用できるノードの推定が可能になる。
1. 悪ノード集合を基点にする
2. グラフを逆方向に探索し不信スコアを伝播させる(減衰付き)
4. 巨大クラスタで異常指標が低い部分を相対的に信頼性が高いと推定
という3層に分類する。
悪を塗りつぶす → 残った未塗り部分が大規模な自然クラスタであれば、それを信用側とみなせる。