大場2015「動作連鎖の概念に基づく技術学の方法」：第２考古学：SSブログ

	ブログをはじめるログイン

「第２考古学とは何か」｜田中2015『考古学で現代を見る』ブログトップ

大場2015「動作連鎖の概念に基づく技術学の方法」　[論文時評] [編集]

大場正善 2015 「動作連鎖の概念に基づく技術学の方法 -考古学における科学的方法について-」『公益財団法人山形県埋蔵文化財センター研究紀要』第7号：97-115.

「ブラインド・テストの必要性？　
大場2013において、石器研究における実験の必要性を訴えた際に、五十嵐彰氏は、氏のブログ・『第２考古学2013』上で、実験研究を行うにあたって、研究者が「実験痕跡」と「実験行動」を正しい方法で同定できるかの信憑性を問う意味で、「ブラインド・テスト」が必要であり、技術学にはそれが位置づけられてないとの批判を受けた（五十嵐2013）。ブラインド・テストは、同定方法の客観性に対する評価という意味で、第三者が作製した痕跡を、研究者が行動に結びつけて判定する手法で、テストされた回答の正答率で研究者の信頼性を問うものである（五十嵐2001など）。たしかに、同定する研究者の信頼性を量る上では、ブラインド・テストは有効かもしれない。しかし、このテストで問題になるのは、テストの正答率であり、方法は検証されない。たとえば、同定の際に不正を行い、高い正答率を得ているとしても、不正を行っているその実態には、正答率のみで見抜くことができない。氏は、研究者が正しい方法で判断できるか、それともできないかと、研究者の方法の信頼性を量るとしているが、このブラインド・テストでは本来的に方法と研究者の信頼性を量ることは必ずしもできないと言えよう。」（112.）

2年前の拙ブログまで言及していただき、有り難いことである。
しかし色々と問題含みの文章である。
2年前の遣り取りの際に示された認識と余り変わらない、ある意味では後退すらしているように思われる点を遺憾とする。

今回示された「ブラインド・テストの必要性？」という小見出しがついた部分は、全部で６つの文章で構成されている（① 大場2013において、…　② ブラインド・テストは、…　③ たしかに、…　④ しかし、…　⑤ たとえば、…　⑥ 氏は、…）。
①は（五十嵐2013）の紹介であり（「…批判を受けた」という述語に対応する主語がよく分からないが）、②は（五十嵐2001）の紹介である。
③で「ブラインド・テストは有効かもしれない」とのとりあえずの結論が示される。
しかし直後の④では、「しかし」という逆接の接続詞に導かれて「方法は検証されない」との観点が示される。
しかしブラインド・テストの趣旨は、「テストの正答率」をもって適用された「方法」が相応しいか（適切であるか）、それとも相応しくないか（適切でないか）を判断（検証）するのである。
「（ブラインド）テストで問題になるのは、テストの正答率であり、方法は検証されない」とは、いったいどのようなことを意味しているのだろうか？　理解が、困難な所以である。
そして⑤では新たに「不正」問題に言及される。
科学的方法を論じるに際して、「不正」などは論外である。「不正」がなされたら、ブラインド・テストだけではなく、石器技術学だろうが、診断的思考だろうが、アブダクションだろうが、すべてお手上げである。なぜこの文脈で、あえて「不正」を持ち出すのだろうか。
そして⑥で「ブラインド・テストは研究者の信頼性を量ることはできない」との最終的な結論が示される。

①と②はともかく、④と⑤の文章を除外すれば、残るのは③と⑥の文章である。
③：「ブラインド・テストは有効かもしれない。」
⑥：「ブラインド・テストは信頼性を量ることは必ずしもできない。」
この二つの文章は、「かもしれない」とか「必ずしも」とか曖昧な語句が付されているが、どのような整合性を有するのだろうか。
ブラインド・テストは有効かもしれないが、必ずしも有効ではないかもしれない？？

「ブラインド・テストは、研究者が正しい方法で分析する、あるいは正しく判断（診断）できるということが前提になるのではなく、研究者が正しい方法で判断できるのか、それともできないのかを判断するためになされるのです。（中略）
ブラインド・テストをする以前に、被験者の信憑性と客観性を疑うのではなく、ブラインド・テストの結果によって被験者の信憑性と客観性を疑うあるいは信頼するというのが、科学的な態度かと思います。」（五十嵐2013-10-27[論文時評]大場2013に対するコメントより）

２年前になされた遣り取りは、いったい何だったのだろうか？

大場2013aでは論題名の中に「石器」という用語が用いられていたが、今回は「石器」という用語はない。ということは、石器資料に限定されない、考古資料全般に亘る議論が目的とされていると考えていいだろう。

以前にも触れたことがあったが、行動と痕跡の対応関係にも明確な一対一関係が認められるものから、曖昧などちらとも言えない、異なる行動が似たような痕跡を、あるいは同一行動が多様な痕跡を生じるというものに至るまで、明確なものから曖昧なものまでそのスペクトラムは連続的で多様である。

例えば、縄紋の原体について。
右撚り(R)か左撚り(L)かは、原体とその痕跡が明確な一対一対応を示す例である。ある程度の知識を得た被験者ならば、100人が100人とも正解を導き出すことは困難ではない。「同定方法の信頼性」は極めて高いという評価が得られるだろう。
ところが、例えばある研究者が縄紋痕跡を仔細に観察することで、縦に置かれた原体を右に転がしたか、それとも左に転がしたかその回転方向を判別できると主張したとしよう（それがどのような考古学的な意味を有するかは置いといて）。その主張の是非を検討するには、どうしたらいいだろうか？
右に転がした痕跡試料と左に転がした痕跡試料を多数その被験者に提示して、全て正答ならその判別方法は有効であり、当てずっぽうで当たるような正答率ならば主張される方法に問題があると考えざるを得ないのではないか？

ブラインド・テストは、行動と痕跡を結び付けるミドルレンジ研究の信頼性を確かめるだけに用いられるわけではない。
日本の旧石器研究では、かつて（あるいは今も？）「母岩識別研究法（あるいは個体識別法）」と呼ばれる方法が一世を風靡したことがあった。ある研究者は、母岩ごとに特徴的な堆積岩（例えばチャートなど）ばかりでなく母岩間にほとんど差異が認められない火成岩（例えば黒曜岩など）についても、全ての非接合資料について、ということは１㎝以下の砕片に至るまで母岩ごとに分類することが可能であると主張した。こうした主張の是非を検討するには、どうしたらいいだろうか？

それには同じ原産地から採取した黒曜岩の母岩10点から、それぞれ10枚の大小様々な剥片・砕片を剥離して、それぞれに乱数表に従って#1から#100までの番号を注記して、それらを母岩ごとに分類してもらうわけである。
こうしたブラインド・テストを繰り返して、その全てに正しい答が得られるなら、その母岩識別原理主義者の主張に軍配が上がる。正しい答えが得られないならば、それは「科学的方法」として問題があると考えざるを得ないだろう。ただ、それだけのことである。

論文全体の中のごく一部のみを取り上げての「時評」となってしまった。乞うご寛容。
こうした議論を契機に、「考古学における科学的方法について」の議論が深まることを期待したい。