「構文解析」を含む日記

2025-11-06

■勉強になった

生成AIにソフトウェア開発を支援してもらう場合、ソースコードの作成を依頼する形式が多いと思いますが、実行ファイルを直接出力してもらうことも技術的には可能なのでしょうか？

生成AIによる実行ファイルの直接出力は、技術的には極めて困難です。現在のLLM（大規模言語モデル）ベースの生成AIは、ソースコードの生成には向いていますが、実行可能なバイナリファイルを直接出力することには根本的な制約があります。

技術的な制約
LLMはテキストベースのトークン処理を基本とする設計であり、バイナリデータを直接扱うことができません。実行ファイルは0と1の連続したバイナリコードですが、LLMはこの形式でデータを生成するようには訓練されていないため、バイナリファイルを直接出力することは現在のアーキテクチャでは実現が困難です。
従来のソフトウェア開発では、ソースコード→コンパイル→アセンブル→リンクという複数段階のプロセスを経て実行ファイルが生成されます。各段階で最適化や機械語への変換が行われるため、この過程を完全に省略してAIが直接バイナリを生成することは技術的に非常に複雑です。

理論的な可能性
研究レベルでは、バイナリデータを扱う試みも存在します。例えば、LLM4Decompileのような研究プロジェクトでは、バイナリコードを逆コンパイルする際にバイナリを一度アセンブリ言語に変換してからLLMで処理しています。逆に言えば、生成時も同様の変換プロセスが必要になると考えられます。

現実的なアプローチ
実務では、生成AIにソースコードを作成してもらい、それを従来のコンパイラやビルドツールで実行ファイルに変換する方式が標準的です。この方法であれば、デバッグやテストも容易で、生成されたコードの品質を確認しながら開発を進められます。
なお、フォントファイルのようなバイナリ形式でもオープンソースとして扱われる例はありますが、これはフォントという特定用途の場合であり、汎用的な実行ファイル生成とは異なります。

画像生成もバイナリを生成しているわけで、同じようなことができるのではと思ったのですが、そこはぜんぜん違うのですね

おっしゃる通り、画像生成AIもバイナリを出力しているという点では共通していますが、実は根本的に異なる仕組みで動作しています。

アーキテクチャの違い
画像生成AIは拡散モデル（Diffusion Model）やGANなど、視覚データに最適化された専用のアーキテクチャを使用しています。一方、LLMはTransformerベースのテキスト処理に特化した構造を持っています。画像生成では、ノイズから段階的に画像を生成するプロセスを経て、最終的にピクセル値という数値データ（バイナリ）を出力します。

データ表現の性質
画像ファイルのバイナリは連続的な数値（ピクセル値）の集合であり、各ピクセルが色情報を持つという規則的な構造です。最近の研究では、画像をビットプレーン（bit-plane）として扱い、XOR 演算でノイズを加えるBinary Diffusion Probabilistic Model（BDPM）のような手法も開発されています。
対して、実行ファイルのバイナリは機械語命令の複雑な配列であり、CPUが直接実行できる命令コード、データセクション、リンク情報などが厳密な形式で配置されています。わずかなビット誤りでもプログラムが動作しなくなるため、画像のような連続値とは性質が大きく異なります。

学習データの違い
画像生成AIは、ImageNetやLAIONなどの大量の画像データセットで訓練されており、ピクセルパターンを学習します。一方、実行ファイルを生成するには、コンパイルプロセス全体（構文解析、最適化、機械語変換、リンク）を学習する必要がありますが、これは単純なパターン学習では実現できません。
したがって、画像生成AIが成功しているのは、画像という特定のドメインに特化した設計と、規則的なデータ構造があるためであり、同じ手法を実行ファイル生成に適用することは技術的に非常に困難です。

Permalink | 記事への反応(0) | 15:50

2025-10-07

■anond:20251007100832

未だにAIとお話しするの苦手

どうしても「AIにとって構文解析しやすい日本語」とかを考えちゃうから自然体で雑談とかできないし、あくまで指示出し用って感じ

お前らと話してる時の方がよっぽど自然

Permalink | 記事への反応(0) | 10:15

2025-10-05

■anond:20251005191534

もう何書いてもバイリンガル以外から反応無いの分かってるでしょ? 日本人は日本語非母語話者の発言をデコードできないんだよ差別意識どころか構文解析が成功しない

認知を言語表現に落とし込む段階から日本語の認知モデルを採用しない限り、解釈可能な正しい現実認識として承認されない。逆にお前みたいな母語が英語の奴はこういう風に英語を翻訳した日本語で言わないと分からないだろ。

Permalink | 記事への反応(1) | 19:39

2025-06-17

■dorawii

読点を明示しないと理解できない残念なやつ。

どのミチ(副詞)ガイジ(名詞)という構文解析が正しい解釈なｗ

Permalink | 記事への反応(2) | 18:23

2025-02-27

■

AIが出力したコードは信用ならん、ディレクションとレビューする能力が必要、って言われてるけど、それも今だけで、あっという間に超人級のエンジニアを凌駕したクオリティのコードが素人でも意図通りに出力できるようになるだろうな

いちいち構文解析の結果を疑ったり、コンパイラが吐いたバイナリを慎重に精査することはほとんどないけど、それと同じレイヤーの話になってく

Permalink | 記事への反応(0) | 08:08

2024-03-01

■anond:20240301000020

ならないが？

そもそも既には「粗探し」にかかってるし。構文解析力もないのか

お前が他責するという表現について粗探し的に批判する

↓

俺弁解する

↓

横増田がそれを粗探しという

↓

俺の弁解が粗探しならお前も既に粗探し的なことしてるぞ

こうだぞ

Permalink | 記事への反応(0) | 12:28

2024-02-25

■自分で調べろは回答になってないぞ知恵カスが

javascriptの結合性について
a=b=1;のような場合、この文に使われている演算子はどちらも同じ=という種類であり、優先順位に差が無いので、左側から解析し、もう一つ同じ演算子があるので演算子の実行を保留し、右側の=を見つけて、右から代入するというのはわかります。
では()すなわちグループ化のような場合はどうなのでしょうか？さいわいこれには結合性はないようですが、あったとしたらどう考えればいいのでしょうか？
=のように右と左をオペランドに挟まれた形ではないので、左側とか右側とかいってもよくわかりませんし、(...)+2の)+のように演算子同士が隣接する場合も考えるとますますどういうアルゴリズムなのかよくわかりません。
それともだからこそ、()には結合性を設けないとしたのでしょうか？

dot dot dotさん
2024/2/25 15:38
a = b = 1
は
a = (b = 1)
と解釈されます。
分かってないのは字句解析しか理解してないからです。構文解析について調べましょう。

調べましょうでもいいんですが、知ってるならそのあなたが同じ疑問にあたったときに調べて解決につながった情報だけを一通り書いてくれるのが一番ありがたいのですが。
「構文解析」なんて漠然とした範囲を調べていたら、たとえ疑問のカギになる情報が目に入っても素通りしちゃいそうですし…

Permalink | 記事への反応(1) | 15:48

2023-12-02

■anond:20231130133508

俺増田は手帳付きのアドハドアスペマンだけど、「俺は読めるし書けるけど構文解析能力の低い一般人が見ると読みにくいだろうなーと思う文章」にはカッコを付けてあげてる

簡潔な短文で完結(ここ気の利いたシャレね)させることもできるけど、最近のネットはすーぐ曲解・拡大解釈して噛み付いてくるキ○ガイばっかりゆえ自己防衛のためにも修飾注釈但し書きモリモリにしとかないと俺が悪いように言われてしまうからね

全ては定型発達健常厨が悪いっ

Permalink | 記事への反応(1) | 00:48

2023-07-01

■anond:20230701095838

・母国語が英語ではないのでネット上の情報量が少ない。

・日本語は構文解析との相性が悪すぎて、それがあらゆるシステムに影響を及ぼしてる（主に検索エンジン）

・解雇規制が原因で組織が腐敗し、新規事業の為に人を雇えないのでSIerが勢力を得た。

あたりやろなあ。

Permalink | 記事への反応(1) | 10:14

2023-03-10

■AI音声合成齧ってたので私見を述べる

論旨

法律によって制限を設けることは個人的には賛成だが、実際に可能なのか疑問に思う（法律に関する知識がないので詳しい言及は避ける）
AI音声合成がAIイラストと同じ轍を踏むとは現時点では考えにくい（以下に述べる）
- 学習手法が十分に成熟していない
- アニメ声優のデータセットが整備されていない
- AI イラストに見られるような対立構造を持たない

演技音声の学習

無断で数千人の声優を学習したというのは、恐らくMoeGoeのことを指していると思われますが、アクセントも不安定で「演技泥棒」には程遠いです。

最新のモデルをもってしてもアニメの演技のような抑揚の大きい音声を学習させることは難しいことであって、実用レベルに押し上げるようなブレイクスルーもまだ起きていないのが現状です。

音声合成の学習には、データセットとして音声とそれに対応する文章を合わせた音声コーパスと呼ばれるものを用います。

演技というものは台本でいうところのト書きであって、文章に直接的に含まれている情報ではないことからも、文章から生成する音声に演技を付与させることの難しさが理解できると思います。

データセットの問題

文章と音声があれば、即座にデータセットとして使えるかと言えばそうではありません。

文章で想定している（文章を構文解析することによって得られる）読み方と、音声における実際の発音が異なる場合があります。

音声合成は結局のところ文章の音素と音声を対応付けているだけなので、音声コーパスの文章と実際の音声に乖離がある場合には学習の精度が下がる恐れがあります。

加えて、現在の音声合成ではアクセントなどの情報を用いることが多いですが、アクセント辞書から得られた情報と実際のアクセントが異なる場合も演技音声では散見されるでしょう。

上に述べた抑揚の問題や、音声にBGMなどのノイズが混ざっている場合など、音声自体がデータに適さない場合もあるため、それらの選別も必要です。

音声合成用に収録された音声コーパスであれば、読み方やアクセント、ノイズ等に細心の注意を払って録音されていますが、一般の音声は必ずしもそうではないのです。

このような読み方やアクセント等の修正は、残念ながら人力に頼らざるを得ません。そもそも台本がない場合は一から書き起こす必要があります。

AI イラストの成功には、イラストへの人力でのタグ付けが寄与していることはよく知られていますが、果たして AI音声という分野において人力による音声コーパスの整備が進むでしょうか？

声優との関係性

AI 音声合成ソフトの代表例とも言えるVOICEVOXはいまや多くの人気を集めており、多くのキャラクターが参加しています。

また、COEIROINKのように音声コーパスを用意することで自らの声を学習させた機械学習モデルを共有できるような音声合成ソフトも登場しています。

AI イラスト界隈における絵師との軋轢が援用されていますが、音声合成の分野においては多くの場合、データの提供者たる声優と相互理解のある関係を保ちつつ発展してきたことを強調しておきます。

その他

動機付け

もともとナレーションの分野においては、既に十分な品質の音声合成ソフトが存在します。

AI イラストと異なり、倫理的問題のある音声合成に手を出す動機付けが乏しいことが現時点において関心が集まらない要因となっています。

ASMRにおける課題

そもそもASMRには、バイノーラルという特色があるわけで、AIが生成したモノラル音声がAI イラストほどの脚光を浴びるとは考えづらいです。

Permalink | 記事への反応(0) | 17:57

2022-11-30

■anond:20221130155638

構文解析は勉強したことないとまずわからないよね。でも趣味でやる人たちもいるくらいだから、ひと通り学べばどうってことはないんだけど。（コンパイラを作るとかなら話は別だけど）

Permalink | 記事への反応(0) | 17:41

■anond:20221129085814

とあるメーカーが出してるソフトの設定ファルを読み込んで色々やろうぜっていう案件やった時にコンパイラ作った経験が役に立ったかな

構文解析とか知らない人たちが書いてたバグらだらけのコードを綺麗に書き直した

元の担当者たちからは訳がわからないとか言われたけど

Permalink | 記事への反応(1) | 15:56

2021-06-18

■anond:20210617145029

設定ファイル読み込み処理がバグだらけで検収通らないのを構文解析の手法導入してまともに動くようにしたとか

Permalink | 記事への反応(0) | 10:16

2021-05-11

■anond:20210511112018

そもそも構文解析までしちゃってる時点で、VSCodeはテキストエディタの域を超えてIDEの一種になってると思うので

別に重くても構わんのでは。

あとVSCodeは日本語の扱いが馬鹿すぎるので、日本で開発されたタフな状況でもマルチバイトをうまく

処理してくれるテキストエディタは手放せないわ。

Permalink | 記事への反応(1) | 11:27

2021-01-04

■anond:20181206153403

VSCodeとかの構文解析までやるエディタはエディタの域を超えてると思うのであんまり好きじゃないんだよなあ。

Permalink | 記事への反応(0) | 13:09

2020-10-14

■anond:20201013213028

私から言えるのは、とりあえず現代社会とか公民勉強してナショナリズム論かじっとこうぜということです

圏論とか関数型プログラミング、構文解析よりもそっちのほうが大事なんじゃないかな？

Permalink | 記事への反応(2) | 09:22

2020-08-24

■anond:20200824171428

Rubyの構文解析器にはbisonを使っているとかそういう話か

Permalink | 記事への反応(0) | 17:23

2020-05-20

■anond:20200520161501

むしろうんち側が構文解析 Botだったりしないのかな

解析特性をハックして1増田に15うんちとかレスしちゃうバグを突いて一時的にクラウド請求額が爆上がりみたいなことをしてみたい

Permalink | 記事への反応(1) | 16:18

2019-10-22

■Blawn

中学生がプログラミング言語を作ったというのは素晴らしいと思うが、その言葉が一人歩きしてるようにも思える

字句解析やら構文解析やらのライブラリもあるから、いまやオレオレ構文言語の開発自体の敷居はそこまで高くない

Blawnもふつうに有名どころのライブラリ使ってるしな

あとサンプル見ても可読性が高いようには思えない

なんでインデントブロックなの？

コンストラクタのオーバーロードどうするの？

クラス内メンバの宣言でいちいち@つけなきゃいけないの？

なぜmain()ないの？

などなど…

この程度だったらおれなんて中学生の頃は毎日さくらたんのエロ同人でシコっていたぞ！

Permalink | 記事への反応(1) | 20:27

2019-01-13

■anond:20190113201203

そのメリットが日本でどこにあるんですかって聞かれてるのわからないのは童貞だから? キーワードさらってるだけで構文解析できない人工無脳だから?

Permalink | 記事への反応(2) | 23:09

2018-09-22

■anond:20180922130419

プログラムやってる人には、vary じゃなくて validate の方が意味わかるなあ

プログラムでデータをバリデートするって言ったら、そのデータが適格かチェックするという意味

文章をバリデートするというのは、コンパイラで言えば、字句解析、構文解析、意味解析を行うということ

端的に言えば、文章が文法的に適格かチェックし、また、意味的に矛盾してる部分がないか確認すること

エラーが見つかれば、コンパイラは処理を停止してエラーメッセージを吐く

つまり、やってることがコンパイラ程度のことで、そこに自分の意見はない、ということを言いたかったんじゃね？

Permalink | 記事への反応(3) | 13:43

2018-06-10

■anond:20180610194444

有名なので言うと「黒い瞳の大きな女の子」文かな。

あなたの文は解釈が定まるけど、こっちは読解力の問題とかではなく、むしろ読解力がある方が構文解析に手こずる。さらに意味は微妙に違うだけなのでコンテキストから判断するのも難しいだろう。

Permalink | 記事への反応(1) | 19:54

2018-04-08

■後で読むサービスを切り替えてみた

いわゆる”後で読む”系のサービスでPocketを愛用してたんだけど、

Instapaperに本格的に切り替えることにした。

①いちいちウェブ画面に切り替えがいらない

PocketではデイリーポータルZとか某2chまとめブログとかはいちいち、

ウェブ画面にして読まないといけなくて、圏外中結構ストレスになってたけど、

Instapaperだと構文解析があってるらしく全ページ記事ビューで読めるのがいい。

これで圏外中でも読めないストレスがかなり減った。

②Tumblrとの連携

IFTTTを使って、pocketでFAVしたの→Tumblrでポストして記録をしてたんだけど、

タイトルとリンクとれてなくて、せっかくのがともやもやしてたんだけど、

Instapaperを使ってみたら、アプリ上でお気に入り→Tumblr　でできようになって、

記事内容がそのまま飛ぶようになっている。

ーーー

いまのところpocket でできて Instapaperが不便な所は見当たらないので、そのまま本格移行するつもり。

次はTumblrのFAV（文章と画像両方意識することなく）をバックアップする方法を考えねば…。

Permalink | 記事への反応(0) | 22:07

2017-06-27

■学校の授業でプログラミングを教えるとしたら言語は何が良いのだろう

自分は情報系の大学生。

弊学では、2年生の時に必修のプログラミングの授業でC言語を習う。

中学生の頃からパソコン大先生でスクリプト言語を軽く触ってた自分としては、わざわざ面倒な書き方で面倒なコンパイルをして動かす事に疑問を感じていた。

ちなみに、試験は紙ベースで、手書きでプログラミングをさせられる。つらい。

スクリプト言語で良いと思ってた自分は、C言語を覚えることに疑問を感じていた。

結局、授業以外で全く勉強せずに試験結果は散々だったが、なんとか単位が取れたので良しとしよう。

プログラミング初学者である人は苦労して書き方を覚えていたように思う。

脱落していった人を何人も見たが、人間やれば出来ないと思っていたことが出来るのである。

本来、プログラミングは誰でも出来るはずである。

今学期、PHPを書く授業とPythonを書く授業を履修してみた。

PHPは、某テキストをもくもくと写経して動かしてみる授業で、独学でテキストのコードを動かす気力のない自分にとっては最高の授業だ。

Pythonは、MeCabなどで形態素解析や構文解析をする授業で、サンプルコードを自分で考えてカスタマイズして毎回レポートで提出する。

Pythonの書き方に慣れないからか、かなりハードであるが、やりがいがあっていい感じだ。

やはり、スクリプト言語は楽しい。

書いたらすぐに目に見える成果が出るところが大きい。

自分は、プログラミングを授業で教えるのならスクリプト言語に限るはずだと思う。

そう思っていた矢先に事件が起こった。

最近、研究室に入ったところ先生が手当たり次第Javaを教え始めたのである。

せめてJavaScriptでいいからスクリプト言語を教えてほしいところなのに、なんでJavaなんだと発狂した。

それでも、30億のデバイスで動くハイブリッドさとオブジェクト指向を理解する上での分かりやすさという面ではJavaが手軽なのかもしれない。

コンパイル言語も悪くはないと思い始めた。

ところで、最近になってプログラミング教育義務化とか叫ばれてるが、Scratchでパーツを並べてプログラミングをするなんてただの積み木に過ぎないと思う。

絶対にツマラナイだろう。

自分は、プログラミングの授業で数字を足し算して黒い画面に表示させるとかツマラナイと感じてしまった。

こんな複雑なことをしても、これしか成果が出ないならやってられないと思うのは自分だけなのだろうか。

お願いだから、プログラミングを教えるのならツマラナイ授業をしないで欲しい。

生徒に分かるように、生徒は楽しんでプログラミングをするべきだ。

別にどんな言語でもいいと思うが、プログラミング言語は人それぞれ好き嫌いが激しいだろう。

自分は、分かりやすくて直感的なRubyというプログラミング言語が学校の授業で採用されるべき言語に間違いないと思う。

別に Rubyにこだわる必要はなくて、スクリプト言語であればなんでも良いと思う。

CやJavaなどのコンパイル言語は複雑で分かりにくいし、教えにくいはずだ。

スクリプト言語を教えた後に、コンパイル言語、オブジェクト指向の概念を教えていくのがいいのではないだろうか。

これは、あくまでもたった1人の大学生の意見にしか過ぎない。

みんなの意見を知りたい。

Permalink | 記事への反応(7) | 15:58

2017-04-19

■今流行ってるOrarioと大学側について思うこと

Orarioについて思うこと

Orarioについて

現在大学の中でOrarioのアクセスがどうこうという問題が起きているようだが、

ひとまずこの記事については、下記URLにある、京都大学の専門家であらせられる記事について、一人歩きしてる感があるので、

もう少し彼のような上流側（という表現で良いかどうかは不明だが）の専門家ではなく、

下流でプログラムをガッツリ書いているほうの専門家として私(匿名で失礼)が纏めたいと思う。

https://srad.jp/~yasuoka/journal/611343/

不正アクセスという言葉の曖昧性

Orarioの芳本大樹が書いた『時間割アプリの「Orario」の特性と安全性について』(2017年 4月17日)という文書を読んだ。このOrarioは、京都大学のKULASISにずっと不正アクセスを繰り返していて、正直なところ私(安岡孝一)としてはアタマに来ていたのだ。

Orarioの特性と安全性について、本当にスクレイピング技術をクライアント端末側で行っているのであれば、

この部分は間違いではないと私(匿名で失礼)は考えている。

この部分の書き方、実に大学教授らしい逃げ道を多く用意していて。

KULASISにずっと不正アクセスを繰り返していて

上記発言、これは本来「開発時の検証段階」の話をしているのであれば「正解」、である。

逆に今のOrarioの通信についてを不正アクセスとしているのであれば「正解ではない」、である。

何せ、開発者が勝手にアカウントを使って入り込んで様々な検証を行う必要があるため、

学生から IDとパスワードを借りたはずだ。

借りてログインするのが不正かというと微妙なラインだと思う。

この辺りにもやっぱり大学教授のいやらしさがあって

KULASISサーバに対してクラッキング/ハッキングを行って根こそぎどうこうしたなどという大がかりな不正アクセスではなく、

あくまで大学側が定める規約規則から若干外れた使われ方がされているという意味の不正アクセスである。

法律的には、正直不正かどうか微妙なラインになる。

（そもそもスクレイピングなんて技術を使う連中はID/PASSWORDがない状態でのサーバへの不正アクセスなどできない

開発時は「京大のKULASISアカウントをもったユーザが開発に携わっていないのであれば」押し出してきている京大の規約によれば、不正アクセスにあたるのかもしれない。

個人的には当たらないと感じるが。

現在動いているアプリは不正アクセスと断言できない

現在動いているものは不正アクセスではなく、

京大の規定に定められたユーザが「特定のブラウジングツール（Orario）」により、

KULASISにアクセスしているのだからアクセスとしては不正ではない。

本当にスマートなWeb スクレイピングで行われているのであれば、Web ブラウザと全く同じ動きをするはずで、

それを不正アクセスと断罪してOrarioは不正というのは表現が汚いと考える。

これはコメント欄にもあるが、

https://srad.jp/comment/3196554

また、ChromeやSafari（及びその他マイナーなWeb ブラウザ）なども御校のWebサーバーよりコンテンツデータを取得し、HTMLを構文解析し画面表示を行っていますが、これらはセキュリティポリシーには適合しているのでしょうか？

ご大層にはっておられるリンクを流し読みをする限り、そんな厳格に何かを定めているわけではないように思われる。

それ故、実際にOrarioがスマートフォンによるスクレイピングを行っているのであれば、

Web ブラウザの一種とも言えなくはない為、これを不正と断ずるのは、「正しくない」だろう

京大のユーザが開発に携わったかを証明できない以上、彼にとっては不正なのかもしれないが、

ここでそれをOrarioは不正アクセスと断ずる論理性が私(匿名で失礼)にはわからない。

アクセス パターンを公開できない理由とは？

他にもこの部分

Orarioアプリでは「Web オートメーション(Web スクレイピング)」と呼ばれる技術を用いています。この技術により、利用者様のスマートフォン（にインストールされているOrarioアプリ）に学生アカウント（大学 ID・パスワード）を入力すると、自動で当該利用者様の教務用ページから時間割の生成に必要な情報のみを取得し、Orarioアプリの時間割テーブルに当該利用者様の時間割を生成・表示することができるという仕組みとなっています。
全く信用できない。少なくとも先月以前、OrarioからKULASISへのアクセスパターンを解析した限りでは、そんな風なアクセスパターンには見えなかった。嘘を書くのもいい加減にしろ。

この部分も怪しいものである。

Web スクレイピング技術に関して、なぜアクセスパターンが問題になるかが一つ疑問である。

下記のOrarioが出しているPDF(http://www.orario.jp/wp-content/uploads/2017/04/Orario%E3%81%AE%E5%AE%89%E5%85%A8%E6%80%A7%E3%81%AB%E9%96%A2%E3%81%99%E3%82%8B%E8%A6%8B%E8%A7%A3.pdf)にあるように、簡単にいうならばID/Passwordを利用したPOST通信を行い、その返答値をスクレイピング（切り貼り）している。

それをアクセスパターンを解析で一体何が取れるのか？という部分が、この辺りが分かる自称専門家の私(匿名で失礼)にもさっぱりわからない。

もっというと、「そんな風なアクセスパターンには見えない」、というならば、セキュリティの観点上公開すべきではないだろうか、

逆に一体アクセスパターンを見て私(匿名で失礼)も何を行っているのかが気になるところである。

ただでさえ、不正アクセスという言葉をつかって攻撃しているわけだから、

アクセスパターンを公開して断罪すべきだし、セキュリティ観点からみても他大学との共有はすべきで、

学生に対してもその証拠を出して止めさせるべきだろう、というのが個人的見解である。

学生の求める「単位」をつかって脅しをかけている時点で、お察しだが……。

そもそも上記で述べた開発時のほぼ不正アクセスと考えられる通信についてを「アクセスパターン解析で見つけた」というのであれば理解ができるが、

現在すでにスクレイピングが確立している通信に関して、アクセスパターンでOrarioかどうかを判別するのが可能かというと何とも言えないと思う。

（ご丁寧にOrarioが通信用のUserAgentにOrarioの文字を含めているなら別だが……

（もちろん、アクセスログを見て、ログインページから Web スクレイピングしたいページへ遷移するまでの時間を取るとあまりに短すぎる、という話ならやれるかもしれないが……。

たとえKULASISが京都大学がオリジナルで開発した大学教務事務パッケージだとしてもそうだろうと考えている。

同様に日立や富士通も同じような大学教務事務パッケージがあるが、

基本ログ処理がザルでろくにuser-agentの確認もできない大学も多く存在したりすることを知ってる自分としては、

本当だろうか？嘘を書くのもいい加減にしろ？　と思う。

大学側について思うこと

なぜOrarioが学生に人気か

UIが糞（システムのスマートフォン対応がノロい）だからアプリが流行るということに気づくべき。

富士通、日立にしてもそうだが、APIを提供したほうがいいのではなかろうか。

とくにKULASISだったか何だったは、京都大学謹製と聞いている（違ったら失礼

少なくとも他の大学教務事務パッケージではなかったと記憶している。

であれば、京都大学がAPIを提供し大学側で専門家を集めてOrarioを超えるものを作ってはどうか？

大学の予算確保の問題

実際大学でこういうことをやろうにも、問題になってくるのは予算で。

大学は、縦割り構造で、横とのつながりが極端に薄く。

教務、事務、学務、図書館、など様々な縦割りが存在し、それぞれがそれぞれの予算でそれぞれのシステムを入れている。

これが実に糞で。

一つの大きなシステムを入れ替えるとなると、横との連携をとって全ての組織の号令をとらなければならない。

その辺りが難しいのは知っているので文句は言えないものの、

ここまで問題になってくるとやはりその辺りの対応の遅さが問題なのではないかと考えている。

まとめ

学生がアホ　→　仕方が無い若いんだし

大学がアホ　→　学生に良い物を提供したいという思いがあるならもっとフットワーク軽くしろ

教授がアホ　→　曖昧な表現で、素人を先導しようとするのが見え見えで気に入らない

Orarioアホ　→　コメントにもあるけどやり方が汚いのは確かだから甘んじて受け入れろ

以上です

Permalink | 記事への反応(4) | 21:37