はてなキーワード: OpenCVとは
WSL2 USBカメラ+他のUSB機器 2022年09月06日版
WSL2 Linux Kernel 5.10.60.1 からKernelモジュールにUSBIP対応が標準的に組み込まれたらしいが、Microsoft公式が提供しているKernelや手順ををそのまま使用すると動作しない
2022年09月06日時点の最新カーネルは 5.15.62.1 だが、wsl --update で展開されるバージョンが 5.10.102.1 だったため 5.10.102.1 を使用する
以下すべての手順の Windows Terminal を使用する箇所は 管理者権限 で実行
以下、[WT] は Windows Terminal、[Ubuntu] は Ubuntu側のbashを表す
WSLのカーネルアップデートと usbipd-win のインストール
> wsl --update
> wsl --status
> winget install --interactive --exact dorssel.usbipd-win
見つかりました usbipd-win [dorssel.usbipd-win] バージョン 2.3.0
Microsoft はサードパーティのパッケージに対して責任を負わず、ライセンスも付与しません。
Downloading https://github.com/dorssel/usbipd-win/releases/download/v2.3.0/usbipd-win_2.3.0.msi
██████████████████████████████ 10.4 MB / 10.4 MB
> wsl --install --distribution Ubuntu-20.04
[WT] WSLのディストリビューションを起動(WSL2起動用アイコンをマウスでクリックして起動してもよい)
> wsl --list
Linux 用 Windows サブシステム ディストリビューション:
sudo apt install -y linux-tools-5.4.0-77-generic hwdata
sudo update-alternatives --install /usr/local/bin/usbip usbip /usr/lib/linux-tools/5.4.0-77-generic/usbip 20
> wsl --shutdown
[WT] USBカメラが usbipd に認識されることを確認する (この記事では 2-7)
2-2 056e:00d9 USB 入力デバイス Not attached
2-3 1c4f:0027 USB 入力デバイス Not attached
2-7 1bcf:2284 Full HD webcam, USB microphone Not attached
2-11 0495:3011 ESS USB DAC, USB 入力デバイス Not attached
2-14 8087:0029 インテル(R) ワイヤレス Bluetooth(R) Not attached
[WT] USBカメラをUbuntu側にアタッチする(アタッチに成功した場合は何も表示されない)
> usbipd wsl attach --busid 2-7
>
[WT] USBカメラが正常にアタッチされていることを確認する(Attached と表示されていれば成功)
2-2 056e:00d9 USB 入力デバイス Not attached
2-3 1c4f:0027 USB 入力デバイス Not attached
2-7 1bcf:2284 Full HD webcam, USB microphone Attached - Ubuntu-20.04
2-11 0495:3011 ESS USB DAC, USB 入力デバイス Not attached
2-14 8087:0029 インテル(R) ワイヤレス Bluetooth(R) Not attached
[Ubuntu] Ubuntuのbashにログオンした既定のユーザを video グループに所属させる。なお、WSLを起動した時点で既に追加されているメッセージが表示される。
[Ubuntu] WSL2上の Ubuntu20.04 の中からUSBカメラが認識されていることを確認する。 lsusb コマンドを経由すると正常にUSBカメラが認識されているが、/dev/video* にはUSBカメラが列挙されない
Bus 002 Device 001: ID 1d6b:0003 Linux Foundation 3.0 root hub
Bus 001 Device 003: ID 1bcf:2284 Sunplus Innovation Technology Inc. Full HD webcam
Bus 001 Device 001: ID 1d6b:0002 Linux Foundation 2.0 root hub
ls: cannot access '/dev/video*': No such file or directory
[Ubuntu] USB CameraがWSL内で認識されるようにLinuxカーネルをカスタムビルドする。下記リポジトリの手順通りに実施すると、WSL Linuxカーネルがカスタムビルドされたものに入れ替わる。注意点は、<windows username> の部分だけは各自の環境のWindowsユーザー名に手で書き換える必要が有ること。なお、.wslconfig は 絶対に windows 側で編集してはならない。絶対に。
> wsl --shutdown
[WT] USBカメラが usbipd に認識されることを確認する (この記事では 2-7)
2-2 056e:00d9 USB 入力デバイス Not attached
2-3 1c4f:0027 USB 入力デバイス Not attached
2-7 1bcf:2284 Full HD webcam, USB microphone Not attached
2-11 0495:3011 ESS USB DAC, USB 入力デバイス Not attached
2-14 8087:0029 インテル(R) ワイヤレス Bluetooth(R) Not attached
[WT] USBカメラをUbuntu側にアタッチする(アタッチに成功した場合は何も表示されない)
> usbipd wsl attach --busid 2-7
>
https://www.imdb.com/de/list/ls599665017/
https://www.imdb.com/de/list/ls599665017/copy/
[WT] USBカメラが正常にアタッチされていることを確認する(Attached と表示されていれば成功)
2-2 056e:00d9 USB 入力デバイス Not attached
2-3 1c4f:0027 USB 入力デバイス Not attached
2-7 1bcf:2284 Full HD webcam, USB microphone Attached - Ubuntu-20.04
2-11 0495:3011 ESS USB DAC, USB 入力デバイス Not attached
2-14 8087:0029 インテル(R) ワイヤレス Bluetooth(R) Not attached
[Ubuntu] WSL2上の Ubuntu20.04 の中からUSBカメラが認識されていることを確認する
Bus 002 Device 001: ID 1d6b:0003 Linux Foundation 3.0 root hub
Bus 001 Device 003: ID 1bcf:2284 Sunplus Innovation Technology Inc. Full HD webcam
Bus 001 Device 001: ID 1d6b:0002 Linux Foundation 2.0 root hub
crw------- 1 root root 81, 0 Sep 6 17:29 /dev/video0
crw------- 1 root root 81, 1 Sep 6 17:29 /dev/video1
[Ubuntu] USBカメラがWSL2の中から認識されることを確認するテストコードを作成する
$ pip install opencv-contrib-python
$ cat << 'EOT' > ${HOME}/usbcam_test.py
import cv2
W=640
H=480
cap.set(cv2.CAP_PROP_FOURCC, cv2.VideoWriter_fourcc('M','J','P','G'))
#cap.set(cv2.CAP_PROP_FOURCC, cv2.VideoWriter_fourcc('Y','U','Y','V'))
cap.set(cv2.CAP_PROP_FRAME_WIDTH, W)
cap.set(cv2.CAP_PROP_FRAME_HEIGHT, H)
https://www.imdb.com/de/list/ls599660855/
https://www.imdb.com/de/list/ls599660855/copy/
while True:
ret, frame
すっかりどこまで書いたか忘れた。
2021年の終わりに↓これを読んだあたりまでだったな。
「Pythonで学ぶ実験計画法入門 ベイズ最適化によるデータ解析」
すげーいい本だったんだけども、実際に活用する場がないんで(なにせ頭を使わない仕事なんで)読みっぱなし。
今考えるとよくないね。
実は、この本に出てくるD最適計画、それからサポートベクター回帰っていうやつが1年後くらいにちょっと役立ったのだけど、それは後の話。
「ゼロつく」のときは理解できなかったクラスの概念も、このころにはすっかり便利さを実感することに。
ここで、もう一度「ゼロつく」に戻ればよかったんだけど、ここまでくると、自分の仕事周りのデータに対しては深層学習って不要だなって思って、戻ることはなかった。
前のエントリで書いた放送大学で「Rで学ぶ確率統計」の単位を無事に取れて調子に乗ってたので、せっかく入学したのだからといくつか授業取ってみた。
統計とかプログラミングの勉強については、「データの分析と知識発見」「コンピュータービジョン」「データベース」の三つかな。
それとは別に人文系の科目も調子に乗って履修してる。もともと数学とか嫌いで歴史とかのほうが好きだし。
「データの分析と知識発見」ってのは、Rを使うやつで、今考えれば多変量解析の入門って感じ。
「コンピュータービジョン」はクッソ難しかったな。
OpenCVってやつの使い方をサクっとパパっと知れるんかと思ったら、ガッツリとエピポーラ幾何とかいうやつから入って行列三昧だったし。
線形代数を知らないエセ理系舐めんなよ!わかるわけねーだろ(今までの本でも行列を触ってきてたけど、雰囲気でなんとかいける、あるいは読み飛ばしてもそういうもんと思って次に進めた。うまく言えないんだけど、100次元とかあるともう諦めてそういうもんだって割り切れるじゃん?3次元くらいだと、ちゃんと現実に戻ってこれないと困るから、ホントに理解できてないのが自覚させられる)
「データベース」もお気楽にSQLマスターできるもんかと思ったら、歴史から入ってガッツリと三層スキーマなにやら、SQL触るのなんてちょびっとだった。
で、このへんでいろんな方向に手を延ばすのもだけど、1つ資格でも取ってみようかなと思って、統計検定に手を出してみた。
大学がエセ理系のポンコツとはいえ、高校出てるんだし大村平の本を読みまくったんだし、受かるだろと思ったが、2級初受験は58点で不合格。
すっかり統計学に恐怖が出てしまったので、2級リベンジの前に「Python3エンジニア認定データ分析試験」とかいうやつに挑戦。
こっちは、ホントに易しくて、統計学がわかってなくてもライブラリの使い方がわかればまあなんとかなるもんだった。
ほぼ満点で弾みをつけて、2級リベンジ。
今度は過去問を買って真面目に机に向かう。
自分、机に向かうってことが嫌いで、ひたすら通読を繰り返すやりかたしか勉強法を知らなかったんだけど、この時ばかりは体に叩き込む作戦。
電卓で計算しては、分布表を読んで、判定して、みたいなルーチンを体で覚えて、見事リベンジ。
しかし、統計検定2級も受からないくせによく、背伸びしていろんな本読んでたもんだよ。
たぶん、わかったつもりになってなんもわかってなかったな。
統計検定2級を取った勢いで、準1級とやらもとっちまうかと手をだしたら、テキストが超難しいの。
4章くらい読んで、挫折して、数か月寝かせる、みたいな感じを何度か繰り返すことになった(結局、準1級に受かったのは2025年になってからだ)。
準1級は、統計学以前に、微分積分とか線形代数の知識がないとテキスト読めない仕様。
日本統計学会公式認定 統計検定準1級対応 統計学実践ワークブック
「式変形については行間を読んで解釈してくれページの都合で次行くからよろしく!」
っていう感じ。
見事に挫折。
統計も、微分積分も、線形代数も徐々にってことで、準1級はいったん休止。
それから、バイオインフォマティクス技術者認定試験とかいう試験をみつけて、興味が出たので公式テキストをとりよせて挑戦することに。
バイオインフォマティクス入門 第2版
元々、生物系だったので、なんとなくわかる単語も多かったし(理系のくせに微分積分も線形代数もヘナチョコって生物系だって丸わかりかもだが)。
これが、ほどよく多変量解析から機械学習からいろいろ網羅されていて、いい勉強に。
重いもの運ぶくらいしか取り柄がない腹が出て禿てきたオッサンが、若い院卒様に頼られるって自己肯定感高まる良い体験。
そこで使ったのが、D最適計画とサポートベクター回帰。
まだまだ鼻くそのようなもんなのに、意外と頼られるっていうことになったんだけど、まあ多いのはデータの可視化だったんで、データの可視化を学んでみることに。
本当は、ggplotとmatplotlibとかplotlyを100本ノックしようと思ったんだけど、やっぱり急がば回れ、有名な教科書の和訳らしいので↓をチョイス
「データビジュアライゼーション ―データ駆動型デザインガイド」
すげーお堅いw
やっぱ、こころのどっかで、「チャっとやったらパパっとできる!」みたいなのを求めてるんだよな。
そんで、二冊目はもうちょっと実務的に↓を選んだ。
『データ分析者のためのPythonデータビジュアライゼーション入門 コードと連動してわかる可視化手法 』
この本はかなり実務的、というかどうすればお手軽に可視化できるかって話だけなんだけど、おかげさまでキレイに見せるテクニックだけは上がり、職場でも評価は上々。
「なんかよくわかんないけどアイツに持っていけば綺麗なFig作ってくれる。ポンコツだからいつも暇だし!」
という状態に。
放送大学で「データ構造とアルゴリズム」とかいう科目を取ったおかげで、意図せずC言語と関わる。
二度とC言語を使うことなんかないだろうけど、グラフ理論がコンピュータと相性がいいのが、データ構造の勉強をしてよくわかった。
そんで、やっとこさ挫折していた統計検定準1級の勉強を再開する。
で、また数章読んで飽きた。
だって、難しいんだもん。
っていうか、線形代数と微分積分の学力不足で投げたことをすっかり忘れて、もう一度開いて投げ出すんだから世話ないわなw
仕方ないから、微分積分は高校三年生の使う黄チャートを買って目を通した。
線形代数は
を一周。
部分積分と置換積分を手足のように使えるようになってやっとこさ、統計学実践ワークブックを読めるように。
読めるようになってから読むと、因数分解くらいの感じでマクローリン展開してきてることがわかって草。
統計の勉強のリハビリにと、放送大学でも「統計学」という授業をとってみたけれど、統計検定2級より易しかった感じ。
プログラミングの勉強はほとんどしなかったけど、Githubのアカウントつくって、renderとかherokuでウェブアプリを公開したりした。
Gitを覚えてみて初めて分かる、「名前を付けて保存」以外のファイル管理を知らなかった自分のヤバさ。
続く。
教授と仲が悪かったので学士で卒業したけど大学3年・4年の間それなりに勉強したぞ!
使ったのはOpenCVだけどな!
そんな俺から見ればAI絵師のやっていることの一部紛れもなくトレパクだ!
少なくともパクリではある!
特徴量をマッピングしてそれをベースに新しい画像を生成しているといってもベースとなる画像の数が少ない場合はただ元の絵をそのまま作っているだけだ!
一度分解した機械をもう一度組み立て直しているようなものでしかない!
たとえばPanasonicの掃除機を分解して組み立て直したとしてそれはもう俺オリジナルの製品でありパナの特許や著作権は失われるのかと言えばそんなはずねえ!
じゃあそのときに他社の製品も一緒にバラして共通して使えそうな部品を組み合わせて新しい掃除機を作ったらどうだろうか?
ネジの規格が微妙に合わなかったから穴を広げて新しいネジに入れ替えたしここまで加工したしこれはもう別物か?
いや流石にちょっと厳しいんじゃねえかって思うよな?
インターネットではそこを指して一部の口が悪い人間は「トレス絵師と同じだ。パクリだ。トレパクだ」と言ってるわけだ!
トレパクの基準が雑すぎることはあるんだが、そうは言ってもパクリ方の方が雑すぎて流石にトレスだろって状況もあるわけだ!
ただ個々で厄介なのがAIは単に特徴量に基づいて似た画像を持ってきて分解と組み立てをしたときにそのタイプの材料が少なすぎて完全にパクっちまったパターンってのはある種の事故でしかなかったりするわけだ!
じゃあ事故を起こしやすい特徴量抽出を行わせればAIのせいにして堂々とパクリが出来るじゃんって邪悪なリバースエンジニアリングが画策されたりもしてる!
つまりAI絵師が無自覚にトレパクをすることもあるし人間がAIにトレパクを命じる危険性も大いにあるのは間違いないわけだ!
この状況に対して危惧する絵師の気持ちは大いに正しいしかといって生成された画像の中には難癖をつけられているだけの可哀想な作品も多いわけだな!
それを防ぐために最初から自分の絵をAIに取り込むことを許可しないよと言ってる絵師が生まれている!
過剰防衛じゃないかと騒いでる人もいるがそれはAIのやっていることを彼らが理解してないだけなんじゃないかって気がしねえか?
さて俺は流石にそういう連中をいい加減黙らせたいと思っているわけだよ!
俺みたいに学校で画像処理を習った人間からすると低レベルな意見が多すぎる!
つまりはコイツらの恥ずかしい意見がもう出てこねえようなバカにも一発で分からせる一言見て―のが欲しいんだ。
なんかねえか?
アダルトアフィリエイトサイトの構築を開始したのが2020年の3月中頃で、あれから早一年が経とうとしている。
仕事の合間に時間を見つけながらチビチビ構築をはじめ、何度も挫折を繰り返し、2020年11月頃になんとかリリースし、現在はそこそこのアフィリエイト収入を得られるようになったので、回顧がてら流れを書こうと思う。
副収入を得たい、と考えていた当時、ぱっと思いついたのが収益型Webサイトの構築だった。
本業がシステム関係なので技術的な部分はそこそこ分かる、しかし実際にWebで稼いだ経験はない。
いろいろ調べていくうちに、「アダルトアフィリエイトは稼ぎやすい」という記事をよく目にした。
性欲は人間の普遍的な欲求でありその需要は尽きることはない。僕はアダルトアフィリエイトのサイトを構築する方針にした。
収益型Webサイトを構築する場合、当たり前だけどまず最初に収益モデルから検討すべきだ。
Webサイトの収益形態としては、ざっくり言うと「クリック報酬広告」「アフィリエイト収入」「ユーザー直接課金」がある。
「クリック報酬広告」は訪問者がクリックするたび収入が発生するが、それなりの収入を求めるなら莫大なPVが必要になる。
「アフィリエイト収入」もそこそこPVが必要だが、最初からアフィリエイトを意識したサイトを構築するだけであれば、そこそこのPVでもそこそこの収入が入ると踏んだ。
「ユーザー直接課金」はPVがそこまでなくても成立するが、課金したいと思えるコンテンツを提供できるかというと自分には難しい、と判断した。
僕は「アフィリエイト収入」をベースとする、アダルトアフィリエイトサイトを構築することにした。
本業が技術職のクセにコードをイチから書くのが嫌だった僕は、高速WordpressのKUSANAGIを使用することにした。
お名前ドットコムで安いドメインを取得し、AWSの無料枠にKUSANAGIをデプロイし、レスポンシブ対応の高速無料テーマであるLuxeritasを採用し、CloudFlareも導入。
金がほとんどかからないのに表示速度は爆速、という鬼の布陣である。
また、WordPressなら投稿処理をある程度自動化できる。
世のアフィリエイター達は商品が売れるように丹精を込めて記事を書いていたりするが、そんなもの糞喰らえだ。
Pythonでコードを書いて既存サイトからスクレイピングして、加工して、Crontabで自動投稿する。これに限る。
KUSANAGI(CentOS)には既定でPythonがインストールされているので、pipで必要なパッケージを追加。
アダルト界の巨塔といえば「Xvide**」や「Pornh**」だ。
世界一のアダルトサイトたちからスクレイピングで動画を取得し、こちらのサイトを充実させようと考えた。
しかし、ここは無修正天国なので、不用意にスクレイプして無修正動画を載せてしまうと日本では即オナワだ。
考えたのが、モザイクあり動画のみを載せているチャンネルから動画を選定して取得しよう、という試み。
とあるチャンネルでは、動画タイトルにFANZAの品番が入っていたりしたので、その品番をキーワードに更にFANZA側でスクレイプし、紹介先ページとして整理できると思った。
収益モデルを最初に考えておく重要性はここにある。どういうコンテンツをサイトに掲載し、どこの商品ページから購入してもらうか?
この流れの整理がついていないと、いいサイトを作ったとしても収益化は実現できない。
「Xvide**」に極上にエロい神動画があってそれを自分のサイトに掲載したとしても、その商品の情報が分からなければ商品紹介も出来ないわけである。
僕は、動画タイトルの品番から商品を特定して紹介する方法であれば、サイトを収益化していけると思った。
まず、「Xvide**」や「Pornh**」は、違法アップロード天国であるがゆえに、動画が削除依頼により次々と消される。
こちら側で取り込んだ動画の死活判定を実装してリンク切れページを削除していくとデータベースが汚れていくし、
今後サイトコンテンツが充実していったあとも追加と削除を繰り返していくのは果てしないことのように思われた。
そもそも、商品紹介をするだけなら、「Xvide**」や「Pornh**」から情報を取得する必要があるのだろうか?
「Xvide**」や「Pornh**」では、動画の内容やタイトルから商品の情報が分からないケースはとても多い。
FANZA公式のサンプル動画でもいいんじゃないのか?そんなことを考え始めた。
僕は、「Xvide**」「Pornh**」からスクレイプする、という方針を辞め、サイトを作り直すことにした。
FANZA公式のサンプル動画からスクレイプする方針に改めたが、単純にスクレイプするだけならそのサイトには何の価値もなく、何か付加価値が必要だと考えた。
そこで考えついたのが、多言語対応型のアダルトアフィリエイトサイトである。
FANZAの公式サイトは多言語対応していないため、それに対応するサイトを作れば国内だけでなく世界中から集客を見込める、と思った。
Wordpressには多言語対応できるプラグインが用意されており、ある程度の自動翻訳もしてくれる優秀なプラグインもある。
それに、AWSのboto3ライブラリを使えばAWS Translateを使っての翻訳も可能。完璧な構想だと思った。
最終的には15言語に対応する構成にし、FANZAの動画もある程度登録が完了し、やっと世に出せる、という状態になった。
ところが、ここでも自分の構想が致命的に誤っていたということを知ることになる。
利用規約にはっきりと明文化されているが、FANZAはそもそも海外から利用できないサービスであり、国内ユーザーのみを対象としていた。
そのため、「FANZAの公式サイトは多言語対応していない」のは当たり前の話で、前提から既に間違いまくっていた。
ようやくリリースまで漕ぎつけたと思った矢先、敢え無くサイトを作り直すことになった。
これが二度目の失敗である。
多言語対応に意味がないことがわかり、サイトの方向性を決めあぐね、いろんなアダルトアフィ指南サイトを徘徊していた。
そこで「エ○タレスト特化型サイト」というものの存在を知った。
実は「エ○タレスト」はアダルトアフィ業界では非常に有名なサイトで、1日で数百万のPVを誇るモンスターサイトである。
どこぞのサイトで見たが、アクセス流入は「3つのS(SEO・SNS・Satellite)」を意識しろ、というものがあるらしい。
SEO・SNSは今さら既出なので多くは語らないが、Satelliteとは中継、つまりアンテナサイトやアクセス交換のことである。
「エ○タレスト」への登録はまさしくSatellite戦略であり、登録して動画が掲載されれば莫大なPVの恩恵を受けることが出来る。
「エ○タレスト」では「Xvide**」「Pornh**」等から動画を紹介する必要があり、公式のサンプル動画は対応していない。
最初の失敗で「Xvide**」「Pornh**」を避けていたが、莫大なPVの恩恵を受けられるなら…という甘い誘惑に負け、特化型サイトの検討を始めた。
まず、ここでももちろん無修正動画は回避しなければいけないし、視聴時間が長すぎる動画もダメ、商品の内容が分からないとダメ、などの依然としたハードルがある。
そこで考えたのが、「エ○タレスト」に既に掲載されている他サイトの動画ページから情報を取得し、自サイトに掲載する、というもの。
既に「エ○タレスト」に掲載されている実績のある動画であるため無修正の心配はなく、商品の情報も取得可能である。
他人の褌で相撲を取るような卑怯極まりない戦略だが、動画タイトルのカスタマイズ性にオリジナルティを加え、サイトを充実していこうとした。
そして「エ○タレスト」に掲載依頼をしようとしていた矢先、2020年10月から「リーチサイト規制」が施行されることを知った。
この規制はつまり、『今までは違法サイトへのURLリンクだけならセーフだったけど、今後はURLリンクだけでも処罰対象になるよ、親告罪だけどね』というものだ。
「エ○タレスト特化型サイト」は、この規制に思いっ切り抵触するサイトなのである。
いきなり全てのサイトを取り締まることは現実的に不可能だし、そもそも親告罪なのでメーカー側の告訴が無ければ問題ないし、それによる処罰を受ける可能性は低いとは思ったが、わざわざ処罰対象の行為でリスクを取る必要もないとも思った。
そのため、「エ○タレスト特化型サイト」も取止め、サイトを作り直すことにした。
余談になるが、2020年12月の「Pornh**」動画一斉削除事件により「エ○タレスト特化型サイト」は軒並み壊滅的な被害を受けることになり、やらなくて良かったと今は思う。
「アダルトアフィは誰でも稼げる」のは一昔前の時代であり、現在は昔ほどは稼げないと言われている。そのあたり、情勢の変化で受ける影響の大きさを肌で感じる。
これが三度目の失敗である。
「エ○タレスト特化型サイト」の撤退で心が折れそうになりつつも、初心に帰りFANZA公式サンプル動画で何かできないか考えた。
夜もすがらサンプル動画を視聴して一人快感に耽っている中、サンプル動画の総視聴時間が再生するまで分からない、というところに不満を覚えた。
「Xvide**」「Pornh**」ではサムネイルに視聴時間が表示されるので、とてもユーザーフレンドリーだ。
ここで思い付いたのが、サンプル動画の視聴時間を表示して一覧として並べれば、それが付加価値になるのではないか?ということ。
サンプル動画の中には視聴時間が5分以上のものもあれば、1分以下の極端に短い動画もある。
極端に短い動画を排除してある程度以上の視聴時間のサンプル動画を一覧化すれば、それだけで価値のあるサイトになると踏んだ。
何より、海賊版サイトを利用せず、正規サンプルを利用する真っ当な方法でポルノ産業に貢献できる、と思うと少し胸が躍った。
方針が決まったので、早速仕組み作りに取り掛かる。
FANZAの新着動画ページから、サンプル動画があるページURLの一覧を取得する。
個別ページから商品情報と動画URLを取得し、動画の視聴時間はFFprobeで取得する。
視聴時間が短いものは除外し、長いもののみ情報を加工してWordpressに投稿する。
サムネイル用の画像は、OpenCVで顔認識できるサンプル画像の中からランダムに選定する。
後は、カスタムCSSをゴリゴリ書いてレイアウトを整形し、表示処理など気に入らない部分はテーマのPHPコードを魔改造して対応した。
2020年分の動画全件に対して視聴時間判定と登録処理を繰り返し実行し、2020年11月、ようやくサイトをローンチした。
構想から構築までおよそ8ヶ月、三度の失敗と挫折を経験して何とかサービス公開まで漕ぎつけることができた。
既に述べたが、アクセス流入のための3つのS(SEO・SNS・Satellite)を意識したアクセスアップ対応はもちろん実施した。
SEO対策は、然るべきプラグインを導入し、SEO対応しているLuxeritasを使ってさえいれば、コンテンツを充実させていけばそれで十分と考えた。
SNS対策は、Twitterアカウントを作成してTwitterAPIの申請を行い、アクセスキーをサイトに登録して投稿後に自動ツイートする仕組みを作った。
Satellite対策は、ランキングサイトやアンテナサイトに登録し、掲示板でのゲリラ活動など水面下でチビチビ広報活動を行った。
結果として功を奏したのはSEO対策のみで、サイトのアクセスリファラのほとんどが検索エンジンからの流入になっている。
なので、SNS・Satelliteの取り組みも強化しなければいけないと思い、この増田を書いている部分はある。そこは勘弁してほしい。
動画の登録処理がリソース不足やスクレイプ先サイトの構成変更のため時々異常終了しており、根本対応にたびたび時間を取られた。
スケジュール投稿が時々失敗したり、Googleサーチコンソールでインデクスエラーを修正したり、今も運用カバーはチラホラある。
しかし、自動投稿の仕組みを作っているので、正直言うと不具合対応以外にやることはほとんどない。
日常的にやっているのはPV確認、収支確認、ログ確認ぐらいのもので、手動更新することを考えるとラクなもんだ。
「運用開始後に如何にラクするか」というのはやはり企画時点から考えておくべきだな、とつくづく思った。
ここまで読んでくれた人なら気になるであろう、サイトへのアクセスとアフィリエイト収入について軽く書く。
WordpressのJetPackを見ると、SEO効果のおかげか右肩上がりを維持できていて、2020年12月は2万PV、2021年1月は4万PV、2021年2月は6万PVと堅調な数字だ。
アフィリエイト収入も12月は約2000円、1月は約6000円、2月は約10000円という結果が出ており、アフィリエイターの挫折ラインである月500円をすぐに超えることが出来た。
アフィリエイト協会の調査によると、2020年は3人に2人は月に10000円も稼げていない状態らしく、僕はとりあえずの成果をあげることができて満足している。
http://affiliate-marketing.jp/release/202007.pdf
AWSの無料枠が今月で切れてしまうので、今月までに成果を出せなかったら潔く撤退するつもりだったが、今ではサーバ代くらいなら稼げそうだ。
もっとアクセスが増えれば効果的な広告を打ち出すことも出来るので、マネタイズ増強を踏まえてもう少し運用を続けてみようと思う。
ただし今後については、全く別の収益モデルにも挑戦してみたいので、今のサイトがもう少し軌道に乗ってきたら、色々と手を広げてみようと思う。
Luxjulia - アダルト動画(エロ動画)無料サンプル蒐集サイト
アダルトアフィリエイトに限らないが、収益型Webサイト構築で考えるべきことは以下だ。
それでは皆さん、さようなら。レッツエンジョイ ポルノ・テック・マネー!
このネタで本書けそうだわ。
毎日パワーポイントと格闘し、Webでは嫌われる役所の詰め込み型の資料を作成してる。
非効率だと世間からは言われるのだが、仕事で求められるのだから仕方ない。
用意されているのは、4GBのノートパソコンと、OfficeとSharePoint。
Outlookでメールでやり取りするのかと言われるだろうが仕方ない。slack使えないんだ。
python、jupyter、scikit-learn、pandas、Numpy、scipy、OpenCV、Dask、PyMCあたりは取り組んで特に問題なくこなせたが、
仕事と結びつかない。ラズベリーパイやArduinoも制御できるが仕事に結びつかない。
matplotlibやseabornで出版に耐えうるグラフが描けるといわれてるが、
主張したい棒以外を灰色にし、アクセントカラーは最小限にして、でも議論ができるように数字は入れる必要がある。
フィッティングカーブもCERNのROOTほどではないし。(ROOTも古臭いが)
何より色の調整がめんどくさい…。いやどっちにしろ仕事には使えないが…。
会社によって制限が違うのだろうけど、PowerShell、Python、VBA、Jupyter lab、OpenCV、MS Office辺りで仕事をしている。
RPA流行ってるが導入されないので、inspect.exeでUI調べるしかない。
COM操作で出来る限りレポートの負荷を下げられないかと思うが、どう判断したかコメント追加しなければならず、減らせない。
実験の効率化もしたいところだが、M2M、IoTが叫ばれてからかなり経つが、RS232C以降になると余計にめんどくさかったりする。
Bluetoothが途切れたりとか。信頼性考えてEtherCATなんて設備組み換えを頻繁するから出来ないし、そもそも計測器についていなかったりする。
ロボットアームも検討したがまだ月100万かかり価格的にもまだ高い。
1年ほど同じ作業するならティーチングするコストもペイできそうだが、数日で実験内容も変わるので、そのコストも馬鹿にならないので諦めた。
メモリ4GBのノートパソコンを出来る限りフル回転させてるが、きつい。
ディープラーニングも自動化出来るかとTensorflowで試したが当たりまでだが死んだ。
MendeleyとGoogleアラートで出て来るのをタイトルと図をざっと見るくらいだ。
論文探したり読んだりするのを効率化するソフトもサービスも足りてないと思う。
matplotlibが定番で、より綺麗なグラフを描くならseabornと言われているが満足できなかった。
ここ(https://qiita.com/skotaro/items/cdb0732ad1ad2a4b6236)にあるようなグラフは参考にしているが、もう少し応用をと思うと難しい。
TableauかPowerBIのような色合いが欲しい。
ディープラーニングをやっていて、むしろかっこいいグラフを描くのを学習してくれと思う。
エクセルでのグラフも手修正にかなり時間がかかるが、Pythonで描いて調整してを繰り返すのは時間がかかって仕方ない。
Plotlyでも良いのだが、こちらも修正しようとすると一仕事となる。
信号処理をしたり、FPGA用のHDL吐き出したり、画像処理やロボット制御はMATLABを使っていた。
Pythonのライブラリはかなりあるのだが、OpenCVとの連携はいいが、ハードとの連携になると微妙に不便。
MATLABも使いやすいかといわれると微妙である。あと高い。Juliaに期待してるがグラフを描くところで早くなくて躓く。
(MATLABをPythonで呼び出せばいいじゃんと言われそうではある)
論文の検索だと、google scholarやhttps://app.dimensions.ai辺りを使っている。
Mendeleyでそれなりに満足しているが、煩雑な感じもするので、もう少し良いのがあれば知りたい。
THKのリニアモータ(http://www.ea-thk.com/?q=ea_jp/node/3903)とか三菱のLM-H3あたりが欲しい。
高速かつスムーズに動く。
ACサーボはロータリーエンコーダのおかげで精度は出るのだが、速度が欲しい。
レニショーやミツトヨのが欲しいのだが、Amazonや楽天などでは買えない。eBayも、AliExpressもない。
3Dプリンターの精度を上げるなら必須ではないかと思うのだが、売ってないので試すことができない。
ブート関係やパフォーマンスチューニングに欲しい。普通に買えない。
RISK-V用のそろそろ出てきて欲しい。
サーボ用のが欲しい。Amazonだと良いのがない。
Amazonですら売ってなくて困る。
・STL標準講座
・Effective C++
・Modern Effective C++
・Effective STL
15年かけC++を独学した。
ずっと一人で努力し、風呂、トイレ、布団の中でも勉強し、プログラムを書いた。
基本情報処理、ソフトウェア開発者試験、ネットワークスペシャリストとデータベーススペシャリストを取得した。
しかし、正社員はもとより、時給2000円の派遣プログラマも時給1200円のアルバイトもスキル不足で何十社受けても一社も採用されない。
とはいえ、面接官のレベルは「STLなんて初めて聞いた」「gccて何かの会社?」
「C++の企画書(誤字ではない)を書いてる人なんてのがいるの?」
「じょーほーしょりしけんてのがあるの?外国の話?」
独身で、一切を我慢して娯楽を全く体験しないまま40歳になってしまった。IT業界の人間すべてが恨めしい。
貯金100万もなく、素人が書いたプログラムに対して手順書のとおりにマウスを操作してエクセルにテスト結果を書くだけの仕事ばかりしている。
Babelink
作った動機は、そっくりNAVIをつくった人と似ていて技術の勉強のためと今ある類似検索のサイトへの不満からです。
そっくりNAVI - 気になる子の顔写真で、似てるAVを検索できるサイトを作った
http://anond.hatelabo.jp/20160719033025#tb
ディープラーニングは最近流行りの技術で、一般的な物体の認識では人間に匹敵するか
今回は自分が持っている画像や有名人に似ているAV女優を探すという
極めて実用的な問題にその手法を試したいと思い、サイトをつくってみました。
■使ったライブラリなど
・PostgreSQL (データベース)
・flask (Web構築)
・dlib (顔検出)
・Awesomplete (入力補完)
ぼくは一応エンジニアのはしくれですが、pythonとか仕事でちゃんと使ったことないレベルです。
それでも3~4ヶ月程度である程度のサイトはつくれるので、みなさんも是非つくってみてください。
■課題
ディープラーニングでは非常に多くの画像を機械に学習させる必要があるのですが、
現状では学習のための画像がまだまだ足りていないので、あまりいい精度はでていません。
あとはディープラーニングで精度を高めるには、ハイスペックなGPUマシンが必要になるのですが、
そんなもの持っていないので精度をこれ以上あげるのは難しかったです。
そんなかんじで、まだまだ改良の余地はたくさんあるので、楽しみにしていてください。
■参考にしたサイト
http://anond.hatelabo.jp/20101203150748
京大で画像処理を学んだ僕が本気でエロWEBサービス作ったった
http://anond.hatelabo.jp/20130122180847
画像の収集はサーバー容量の問題もあり、していないので画像検索を気軽に試してみてください。
Babelink
条件に該当するサイト、リストアップいただきありがとうございます!
https://jjyap.wordpress.com/2014/05/24/installing-opencv-2-4-9-on-mac-osx-with-python-support/
OpenCVの導入解説として、初めてこの操作をする人に向けて丁寧に説明されているのは素晴らしい。初めて取り組む人に向けては、ここまで噛み砕くと不安感を払拭できてよさそう。ただし、慣れている、またはOpenCVを実際に使って云々と解説する場合は、コマンドの例は飛ばす方がすっきりしそう。
http://kometchtech.blog.fc2.com/blog-entry-1173.html
わからないことはわからないと書くのは、賛成。Qiitaのような知見をさくっとまとめるサイトなら、これくらいがいいかも。
問題が起きたときに、わからないと一旦置かれていた部分を追いかける必要があるフラグも立ちやすい。
苦しんで覚えるC言語
http://9cguide.appspot.com/ にもアップされているものと同じ?もしそうだとしたら、解説→ドリル→解説…と、学習参考書に近いものを求められているのかと理解している。
自分自身が持つ技術水準や、求められる情報(導入, 応用, ケーススタディのサイズ)によって、読んでもらったときに理解してもらいやすいものは違うことを、別の観点から知ることができてGoodでした。
---
さて、自分自身が先に示された6つの条件を満たしていると考えているブログはこんな所。
上記2つはいずれも読者に「ある程度」の知識があることを要求している。その上で、運用している上で遭遇する問題…それもドキュメントにない情報…を、後で同じ問題に遭遇した人が問題解決を再現できる水準で記録されていることに感服する。
ただ最近はまず公式とマニュアルを見に行って、よくわからなければググって傍系のStackOverflow(一番これが多いです)・英語圏のブログ・解説サイトに行く、エラーが出たら--debugしてみてよくわからなかったらエラーをググるなどの使い方をしているので、あまり日本のブログにぶち当たることは無いです。
これは同感。公式マニュアルを見たら解決する問題が多いし、公式マニュアルで嘘をつかれる可能性は比較的低い。
---
技術ブログを書いている人間として、嬉しいなと思うのはこんな順番。
で、何より嬉しいのは、なんてことはない話だが…
である。
OpenCVの次期バージョンではPython3に対応するそうだよ。
http://opencv.org/opencv-3-0-alpha.html
いまの最新はbetaだけど試したら?
今選定段階なんじゃあないの?
http://getlife.hateblo.jp/entry/2014/02/06/030300
こういう無知なおっさんが居るから、日本のIT業には魅力がないのだよなぁ、という印象
自分はプログラマというよりは、どちらかというと研究で飯を食ってる非SIのエンジニア
このブログの著者のおっさんが言うところの、プラスアルファは手に入れてる側ではあるんでしょう
普通のプログラマであることでは、差別化が出来ないと考えたからこそ様々な挑戦を繰り返し
基本的には、実装スキルのない人間の設計などはものの役に立たない、という所は同意して貰えるだろうけど
逆に、コーディング以外の技術、例えば無知なおっさんが例にだしてるデータサイエンティストであれば
統計だの機械学習の学術的な知識、体系だって勉強してきた数学力がなければ、まともな設計はできない。
各アルゴリズムがどんな計算をしていて、どの程度の計算量を要求し、どの程度の資源を求めるか、誤差はどうか、
負荷はスケールアウト出来るのか、他にいい手法は存在しないか、といった知識は一朝一夕には手に入らない
実際のコードをイメージしながら、各モジュール群を適切に設計し運用するには、どちらかでは不足がある
つまりコーディングスキルを含めた言語などの道具への理解と、それを使った技術力、そして経験は不可分のもので
揃ってやっと1人前の”プログラマ”と呼べる。そういう人間だからこそ、高給取りになれる。
プログラマ=コーダという認識は、プログラマという職業や技術を軽視しすぎている人間に見られる
結局のところ、プログラムを書く人(=コーダ)ではなく、プログラムを使ってビジネスが出来る人(≠コーダ)が生き残るって面では日米大差ありません。
ちっちゃい商売で食えてることがこの人の自慢なんだろうけど、これこそが日本のSierがゴミな理由だ
世の中にどんな技術があり、どんな研究が進んでいて、何が出来て、何が出来ていないのか?
それを知らない人間が良くこういうことを言う、顧客のニーズを汲み取れるだけでビジネス(笑)が生まれるとかないでしょ
例をあげると、海外ではCADのソフトの研究開発は盛んだけど、もう国内では殆ど生き残ってない。
国内には世界的な自動車メーカーがあれほどあるにも関わらず、CADソフトは国内には著名なソフトがない
こういう例には枚挙にいとまがない。日本のゲーム企業は世界的だがそこで使われている、ツールやらレンダラは海外製だし
SIerお得意のビジネス(笑)を生み出す、クラウド、分散コンピューティング関係でも、OpenMPIなど海外製だ
GitもMercurialも海外で生まれているし、OpenCVを初めとした画像認識ソフトやその技術も海外で生まれている
カメラによる画像認識で車や人を判断してブレーキする車は日本で作られるが、その根幹を為すアルゴリズムは
海外の研究者やらエンジニアが作っている訳だ。広大の栗田先生など一部例外はあるけれど。
それぞれ、SIerが言うビジネス(笑)なんか比較にならないほどの市場規模を持っているのに、それらを無視してビジネスとはなんだろうか?w
電機・機械系では、研究開発が盛んで、技術と儲けることは不可分なのに、IT業界だけはどういうわけか
ビジネスとは技術を何一つしらない無知なおっさんが作るものであるらしい
本物のプログラマにとっては、全く魅力がない、そんな業界な訳だ
お客からしたら技術の中身なんかぶっちゃけどうでもいいんです。JAVA で書こうが、Cで書こうが、COBOLで書こうが、そこに価値の本質はないから。
道具というのは、それを適切に選択して使ってこそ価値がある。
フランスではOCAMLが普及しているが、なぜだか考えたことがあるか?
何を選択すればコストが抑えられるかをすら考えたことすらない
言語なんかなんでも一緒?w
なるほど、鋸でなくともノミでも木は切れるだろうなw
切断面の美しさやかかった時間などは客には関係ない、切れてさえいればいいかw
お客にとっては技術などは確かにどうでもいい、しかし、それを上回る製品がないという前提だ
どうやって世界と伍して戦う?
どうやって他の製品を上回る?
微々たる使い勝手の差などは、技術力の差の前では圧倒的に無力だということは
データベースはオラクルだのSQLに依存し、製品ではSAPなどに完敗を喫し続けているSIerこそ理解すべきだろう
本当にビジネスを作る、というのが、技術と不可分なのは言うまでもない。
もちろん、その技術にはコーディングスキルも含まれている、という当たり前の話です。
オッサン論法でいけば、SIerがサービスとして提供するものと、同一の機能を持った製品との間の明確な区分など
客には存在しない。どっちのほうが凄くて安いか、だ。
そんで、もう、そういう勝負に負けまくってるのがSIer、技術で勝てないから安さで勝負するために
オフショアに必死になったり、ブラック企業化してプログラマを潰しては、ますます技術力とサヨナラしていってるね
http://anond.hatelabo.jp/20140206172641
普通は「IT系」って企業の一部門だし実際日本でも自動車メーカーやら電機メーカーやらゲーム会社やら内部でプログラマーを雇用して国際的な成果も上げてる企業なんていくらでもあるんですよね。
全くだな。
技術力をもった企業やエンジニアがフィーチャーされるべきなんだが、例えばゲーム屋だと
プロデューサーだのディレクターだのが表に出て学生のあこがれの対象になるし、
他もプロマネが表に出てくる事が多いので、文系職の比重の高さが問題なんでは・・・みたいな方向になるよな
大手でもホンダ、ソニー、日立など、研究部門が成果を上げている、中規模でもデンソーとか良い企業もあるし
小さい会社だと、先日googleに買われたシャフトとか、CADのラティスとか、モーションポートレイトなど、固有技術で食ってる会社もある
ぬいぬいをNUINUIしたい。
つっついたり、つまんだり、つかんだり。
ぬいぬいは、ゲーム艦これに出てくる氷雪型人格の女の子のことで、
NUIとはNatual User Interfaceの略、"自然な"操作やコミュニケートを指す言葉で
キネクトとか、リープモーションとか、そんなの。
まぁ、つまり、ぬいぬいをNUINUIしたいとはそういうこと。男の夢。
インテルがRealSenseを発表したという記事を読んで
久々に目にしたNUIという説明に、
世界の誰もが寒いと思おうが、自己満足を満たすおっさんの思いつきは
最高の燃料だ。指先を動かすだけの傍らで、脳裏では様々な探索隊が
私の持つあらゆる知識に可能性を探しに出かけてる。
ぬいぬいをNUINUIしたい。
あらゆるところへ妄想は飛びし、
そして、定時。何故か私の仕事は終わっており、