‘WEBサービス’ タグのついている投稿
IT系、技術系の情報のクリップを蓄積したサイト
3年くらい前から、IT系、技術系の情報をクリップしていました
http://week.dgdk.net/
SNSのシェアやブックマークサービスなどを使っても良かったのですが、分類するのが面倒だったので、ページタイトルから形態素分析で単語に分けてタグ付けしとけばオーケーみたいな感じのものを作って記録していました。
クリップの仕組み
ページのクリップはChromeの拡張機能を自作しました。単純に該当ページのtitleタグとURLをサーバに送信するだけの拡張機能です。
拡張機能から送信されたtitleタグの文字列は、Yahooの形態素解析へ送信して単語に分割します。その後、title、URL、分割した単語を、それぞれ記事のタイトル、本文、タグとしてwordpressに投稿します。投稿は即公開されます。
実際の操作は、気になったページを開いて拡張機能ボタンをクリックするだけ。拡張機能ボタンなのでメニューを開くこともなく、1クリックだけで記録できる。
ざっくりな形態素解析ではあるけれど、それなりに興味深い
終了なんてタグで検索すると、色々なサービスが終了したことを知ることができるし、そのサービス名のタグで検索すると、開始した時のリリースなんかも見つかったりします。たとえばタクシー配車サービスのHailo。
さすがに3年続けていると始まりと終わりの両方が把握できるもんだな、なんていう感慨にふけります。
ここから先はあるあるネタ
分類の手法で常に出てくるものとしては、類語でタグができてしまうのを整理できれば、とは思います。オラクルとoracleのような状態を1つに出来ればモアベター。
形態素解析の元がページのタイトルなので、サイト自体のタイトルもタグになってしまうのはノイズの要因になっています。朝日新聞なんかがそうです。フィルタをかけて外したりもできるのでしょうけれど。
それと、やっていて気づいたのが、ページのタイトルに本文の内容を表記しない所がそれなりにあるということ。例えば日立のニュースリリースは「ニュースリリース:日付:日立」の形式なので、同日のリリースはすべて同じタイトルになるし、amazonなんかはそもそもtitleタグが無かったりします。発信する側はそういう所まで気にしない傾向があるのかも知れません。
Amazon Web Services(AWS)の無料利用
無料枠でテスト的に使うとして
AWSは、業務で使うことはあるけれど、テスト的に導入するといった場合にどれだけ気軽に出来るのか?ということは考えたことはなかった。制限があるし、その制限が無いことがAWSを使う利点でもあるという意識があったからだ。
とはいえそこで否定するのもアレなので、もし無料利用する場合にはどんな条件なのかをメモしてみた。
参照元は クラウドサービス 無料利用枠のご案内 | アマゾン ウェブ サービス(AWS 日本語) で、2013年11月17日現在の情報なので、あくまで参考までに。
前提として利用期間は12ヶ月間でさらに月内の利用時間に上限がある
AWS新規申込みのユーザーに対してのサービスで12ヶ月間の提供となっている。1年無料ということ。
さらに以下の制限がある。
- EC2はマイクロインスタンスで750時間/月
- ELBは750時間/月でデータ処理料が15GB/月
- データ転送が15GB/月
- ELBは30GBで200万IO/月
- S3は5GBで2万Get/月 2000Put/月
- RDSは750時間/月
月750時間というのは、24時間×30=720時間なのでEC2を1台起動しっぱなしで問題ないと判断出来る。複数台の場合は起動しっぱしは出来ない。AWSの柔軟な部分は切り捨てて1台のレンタルサーバと考えれば問題ないとは言える。
データ転送が15GB/月なので、大きめのファイルやトラフィックの多い場合には注意が必要だ。ソフトバンクのテザリングが7GB/月を超えると速度低下が発生するということなので、15GB/月というのもそこまで余裕のある数字では無いのかもしれないが、そもそも論でそんなにスペックの高いサービスでは無いことを考えると、高トラフィックでデータ転送量が跳ね上がる恐れはそこまで無いかも知れない。そんなに心配ならばチェックしよう、ということだとは思う。
1台のレンタルサーバとしてのスペック
EC2で使えるインスタンスはマイクロインスタンス。マイクロインスタンスのスペックはインスタンスタイプを参照すると以下のようになっている。
- vCPU 1
- ECU 最大2
- メモリ615MB
- ストレージ なし(EBSのみ)
- ネットワークパフォーマンス 非常に低
AWSの考え方前提なので他のレンタルサーバと比較するのは簡単では無いけれど、乱暴にまとめると
- CPU 1個で共用
- メモリ 0.5GB
- ストレージ 30GB(IOの回数に制限付き)
- ネットワーク 遅い
というVPSサーバ1台に相当する。さくらのVPSの1Gよりも低いスペックだと判断しても良いと思われる。
経験上、メモリが1GB無いとapache+phpだけでも物理メモリを圧迫する。mysqlをRDSに外出しするにしてもリソースギリギリの構成だと想像できる。
980円/月のプランより低い、期間限定の無料プランだと考えれば仕方の無い内容だとは思うけれど、そこまでしてAWSを使う理由は感触を確かめたりオペレーションの学習といった理由以外ではあまり利点は無いのではと考える。
セットアップの手間などはどこまで一般的に想定されているのか分からないのですが
これは他のVPSやクラウドでも言えることだけれど、セットアップは自前で行う必要がある。
この部分、自分では感覚がズレていることだけは分かっているのだけど 通常サーバを借りる=必要なシステムは用意出来ている という感覚であるならばAWSではもう一手間、しかも今まで知らなかったような作業が発生することになる。
今はネットで検索すれば、セットアップ方法もそれなりにあるだろうし、それの練習だと思えば問題ないけれど、無料のレンタルサーバのサービスだと考えてしまうとハマってしまうのでは無いかと思われる。
RSSフィードの認知はどこまであったのだろうか
引き続きのRSSネタ。
ブログパーツにRSSフィードありましたよね
ブログのサイドに置いてあったフィード表記が、最近はあんまり目に止まらなくなった。
いつからかは分からないけれど、気がついたのつい最近。Google Readerの騒動があってから。
chromeのエクステンションを使うとソース中の link rel=”alternate” を探してくれてアドレスバーにフィードアイコンを表示してくれるので、そればっかりに頼っていたのだけど、きっと数年前から少しずつ減っていったのでは無いかと思う。
ブログサービスのデフォルトの設定が非表示だったりするのかも知れない。
そういえばこのサイトも出してない。wordpressはデフォルトで表示しているけれど、わざわざテンプレート直した時に非表示にした。
やっぱりわかりにくいですよね
非表示になったとしたならば、その理由は何となくわかる。
・ユーザーにとって、そもそも何かわからない。
・表示の文言も意味不明。RSS2.0とかatomだとか複数あったりする。
・あった方が良いものなのかが分からない。
などなど。
フィードについてハッキリした説明が無いし、簡単に出来そうもない。記事を書く人にとって良いものだと思わせる分かりやすい何かが無い。
ブログサービスが流行り始めた頃は、WEB2.0なんて言葉が出まわっていて「RSSも先進的な何か」ということで許容されていたのかも知れないけれど、普及してしまったことで、その存在の説明をすることよりも引っ込めた方が良いと判断したのだろう、と推測できる。
実際、分かっている人は分かってるわけで
ソース上の記述を追って、フィードのURLを見つけて登録という仕組みは、それがちゃんとソース中に記述されている記事のURLがあれば可能だ。
上でも書いたけれど、エクステンションなんかを使えばブラウザのインタフェイスでフィード登録出来てしまう。
サイト上にフィード表示が無くても、積極的にフィードを使う人にとって特に面倒は無いわけで、結局表示しなくても良いじゃないですか、という話に落ち着く方向性なのだろう。
実際自分もそうだ。
ページビューは落ちる可能性がある
RSSリーダを多用すると、そのサイトを閲覧する機会が減る。記事は読むけれど、そのサイトに行かない。フィード表示が無くなりつつあることに気づかなかった理由の一つでもある。
本文抜粋のサイトは、全文読むために訪問しなければならない。人は怠け者に出来ているのか、そういう記事はよっぽど見たい内容じゃないと、そこまでだけでパスしてしまったりする。
だとしたらフィード配信している意味って、そんなにあるのだろうか?という風になっても不思議じゃない。
ページビュー数を誇るアメブロのフィードは記事の抜粋で、画像も非表示となっていることが多いのは、サイトへの訪問を狙ってのことだろう。
というなんとも微妙な位置のRSSフィードなのだけど
Google Reader終了アナウンスで、色々な人が困ったことが明るみに出た。なんだみんなフィード読んでるんじゃない。
WEBは日々進歩していく技術が多く、先進性や新規性、そしてそこからくる収益性に注目される事が多い。わざわざ損するような技術を採用しようと考える人は少ない。
RSSフィードはとても便利な技術だし、使うことで損することは決して無いけれど、地味に普及してしまったために
「で、それで新しいこと出来るの?」
「で、それで話題を集められるの?」
「で、それで儲かるの?」
といった面が現状とても弱い。
Google Reader騒動でも「終わった技術」なんて揶揄を目にした。新規性という意味では枯れつつある技術だと言えるけれど、まだまだ使える技術ではある。
GoogleSiteSearchとGoogleカスタム検索
サイト内検索をしたいという要望はウェブサイトが出来てからずっと存在する。
最近ではGoogleなどの検索エンジンを埋め込むという手段で簡単に済ませるケースも多い。ユーザーもそれに慣れているので違和感を感じる人も少ないようだ。
ただし商用サイトなどで不要な広告、場合によっては自社製品やスポンサーなどなどの関係で検索エンジン側の広告を出したくないというケースもある。
その場合には検索エンジンの有料サービスを使うことになるのだけれど、さてさて、いくらくらいかかるんだっけ?というのを毎回探して、ハウツーページを見て回ったりすることになる。
サービス本体へのリンクが見つけたいのだけど昨今のSEO技術向上の影響なのか、なかなか上手いこと見つからなかったりする。
このページもそんなノイズの一部になってしまうかも。
ということで、Googleのサービスへのリンクをメモ書きしておく。
無料サービスである「Googleカスタム検索」と、有料サービスの「GoogleSiteSearch」の機能比較
Google Site Search と Google カスタム検索
http://support.google.com/customsearch/bin/answer.py?hl=ja&answer=72326&topic=1717074&ctx=topic
Googleブランドや広告が出るのが気にならなくて、そんな大規模なサイトでなければ、Googleカスタム検索でも十分で、それ以上は一律有料サービスですという割り切りじゃないかなと思う。
有料サービスで何が出来るかはとにかく問い合わせて下さいというイメージなのかな?
この辺はGoogleでも普通のシステム屋さんとあんまり変わらないスタンスというか、定石なのだろう。
有料サービス「GoogleSiteSearch」の料金
Google Site Search の料金
http://support.google.com/customsearch/bin/answer.py?hl=ja&answer=72334&topic=1717074&ctx=topic
年間の検索クエリの件数によって金額が変わってくるということは、どのくらい検索されますか?という部分を検討しないと予算は決められないですよ、という当たり前の質問が発生する。
そういう数字を意識してサイトデザインしないといけないですよと暗に教えてくれている。ありがたい。
でも、GoogleCheckoutで2000ドルの支払をするとか、慣れていないだけなんだろうけれど不思議な気分がする。クレジットカードで支払うのと実質は変わらないんだけど。
お名前.comからムームードメインへレジストラの移管
mybenjo.netドメインをお名前.comから取得して10年以上経つ。
当時はドメインの業者もそんなになく、メジャーだからという理由で取得したのだけど、今ではもっと安価だったり使い勝手の良いところも増えた。
最近はムームードメインを使うケースが多く、価格もお名前.comより安いので更新が迫った今のタイミングでレジストラの移管をやってみた。
お客さんが増えるのは嬉しいですよね
ムームードメイン側では、管理ドメインが増える=お客さんが増えるということで親切な説明ページを用意している。
ムームードメイン – 移管申請の流れについて
http://muumuu-domain.com/?mode=guide&state=tp_flow_user
同じようにお名前.comにも説明ページがある。
ドメイン設定-ドメインNaviご利用ガイド
http://www.onamae.com/guide/domainnavi/config/004.html
認証コード(AuthCode)はどこ?
ムームードメインのアカウントは持っているので、入力は移管ドメインの情報入力だけ。
ドメイン名とドメインは自明。認証コード(AuthCode)をお名前.com側から持ってこないとならないのだけど、これを探すのにちょっとだけ手間取った。
探すというか該当するドメイン詳細にAuthCodeという項目があった。この情報を入力するだけ。
これであっさり移管申請中になった。
お客さんが出ていくのは寂しいですよね
認証コード(AuthCode)についての記載は、よくある質問の中にあった。
お名前.comから他の登録業者へトランスファーする方法は?(.com/.net/.org/.info/.biz/.mobi/.cn/.us/.tw/.name/.bz/.vc/.sc/.cc/.tv/.in/.asia/.la/.ws/.mn/.hn)
http://www.onamae.com/support/faq/transfer/out/out_01.php
ムームードメインも同じく、よくある質問にあった
ドメインの移管について
http://muumuu-domain.com/?mode=faq&q=2
分かっていれば簡単な話だけど、移管という同じグループとして、入ってくるのも出ていくのも説明を一緒に扱ってくれたらなぁって思う。
それと、お名前.comは結構簡単に別ウィンドウが開くので、気づくとさっきの情報がどこにあったか探しにくい。一発でその情報に辿りつければ、そうはならないんだろうけど。
セブンイレブンのネットプリント
先日のエイトビットカフェ 5周年PARTY 【 ゴウテンゼロ! ! ! 】でのこと。イベント開始前のリハーサルで、出演者の方が予定と別の曲をやろうという話になり、急遽、譜面を用意しないといけなくなった。譜面のデータは自宅にあって、データは持ってこられるのだけど、印刷する手段が無い。さてどうしようということで、セブンイレブンのネットプリントを利用した。
ネットプリント
http://www.printing.ne.jp/
譜面のPDFファイルを、ネットプリントにアップして、発行される8桁のプリント予約番号をメモして近所のセブンイレブンで出力するだけ。出力時には、お金を入れて予約番号を入力するだけ。エイトビットカフェからは新宿2丁目店がすぐそこだったので、イベント前にさっと出力が出来、大きなトラブルなく別のお祝いの曲の演奏が実現できた。
このサービス、セブンイレブンはあちこちにある割りに意外と知られていなくて、驚かれることが多いのだけど、急な印刷が必要になった時にはかなり心強い存在だ。iPhoneアプリも用意されているのでgmailに飛んできたPDFを印刷するなんて場合にもiPhoneだけで実現できる。セブンイレブンに寄る機会があったらチェックしてみたら良いと思う。
netprint 開発: Fuji Xerox Co., Ltd.
http://itunes.apple.com/jp/app/netprint/id372351201
ファイルは、オフィス文書や画像、PDFに対応していて、1ファイル2MBまで。フォントの制約などもあるのであまり複雑だったり大きな文書の印刷は出来ない。また印刷は1枚20円からで決して安くはないが、いざという時の出力手段がセブンイレブンで担保されるというのは、状況によっては心強い。自宅でA3カラー出力が出来ない場合なども、このサービスで補完することが出来る。
SEO対策の一般論
仕事の中でSEO対策の話がでることはままある。
方法論として基本的なことから、その時々でトレンドとなっているテクニック、場合によってはちょっとズルイことなどなど、色々な事例、対策がある。自分のような開発の人間のほかに、SEO専門のコンサルタントが付いている場合などは、そちらからの指示が来る場合もある。
SEOなんて言うと、ちょっと専門用語チックな雰囲気があるものの、結局その目的は「多くの人が普通に思いつくワードで検索したら、普通に欲しい情報に辿り着ける」ようにするもの。
そして、その中に自分のサイトも参加して「出来るだけ多くの人に見てもらう機会を増やす」にはどうすれば良いかを考えれば、それが自然とSEO対策なるのだと考えている。
検索エンジンのクローラというシステムは実際それを目的として開発されていて、そして日々改良されているわけだろうし。
こんなフワッとした話よりも、具体例を求めるケースが多いだろう。
でも、具体論の前段階にある考え方をサイト運営の中で忘れずキープできれば、結果自然に検索上位に行くのでは無いかと思う。当たり前のことを真面目にやろうという考え方。
そもそもプロモーションの一環としてSEO対策があるというだけのことで、場合によっては有名人がテレビやラジオや雑誌でサイトを紹介してくれた方が遥かに効果があがったり、検索上位にいかなくてもサイトの目的が大きく達成できさえすれば、それはそれで良い結果だとも言える。
ということで、具体例は無いけれど、こんな感じの考え方をGoogleだって説明していますよ、というPDF資料が公開されているのを紹介。現時点で2010年9月の更新が最新版。
検索エンジン最適化 ( SEO ) スターターガイド
twitterやfacebookなど、SNSでの情報提供の今後について
これから、どういう風にユーザーを獲得してけば良いんでしょうねぇなんて会話から話が広がったのでメモ。あくまで肌感覚ベースなので当然のことながら全てが正しいわけではないけれど、一つの視点ということで。
mixi離れという状況
日本国内で最大規模のSNS、mixiからユーザーが少しずつ離れつつある状況にあるようだ。
自分の周囲では、アカウントを持っていてもたまにしかログインしない、もしくは殆どしないという人が少しずつ増えてきているし、そのことをtwitterでつぶやいているのを目にする機会もある。
原因は色々とあるんだろうけれど、元々あった「人と人が結びつくサービス」に関する純度が下がってしまったイメージが強く、mixiで呼びかけることで結構な数のリアクションが得られるだろうという期待が薄れつつあるようだ。
簡単に言えば、人は大勢登録されているけれど、実際には人がそんなにいない感じになっているのだと思う。実際、自分でもそう思う。
mixi離れで困ること
mixiが情報発信の中心として存在する方式が機能しなくなることは容易に想像できる。
イベントグループやファンの情報交換、リアルで人々が集まるお店やイベントスペースにとって大きな問題になる可能性もある。ただ、ユーザーが減ったからといって情報発信を止めてしまうと、残ったユーザーの「難民化」が起きてしまうし、その一方でユーザーの熱量が下がってしまったことから発生する尻すぼみ感を防ぐのも、それはそれで難しい。
それに代わるSNSなどのサービスが分かりやすく存在するわけでも無いので「これからはtwitter中心になります。よろしくね。」なんてアナウンスしたところで今と同じように継続できるかは微妙なところ。
その代わりとなる存在とは
では、mixiにあまりログインしなくなった人達はどこへ行ったのか?という疑問。
考えられるのはtwitterやfacebookだ。特にtwitterは、一時期twitterのツイートをmixiボイスに同期することで、mixiボイスのタイムラインを占領してしまう問題が発生したように、twitterが主でmixiはサブという状況が実際に起きているようだ。facebookも、同様にtwitterと同期できるわけで、今のところはtwitterが主になりつつあるんだろうなぁという感触。
とはいえ、twitterとmixiでは仕組みが違うわけで、mixiと同じ方法論でアクティブユーザーを集めることが出来るわけで無いというのは自明。これもまたfacebookでも同じ。facebookの方が機能面ではmixiに近いけれど、mixiも当初機能が削られたわけでないのに今の状況が起きているということから考えると、mixiの成功はその時のmixiでしか出来なかったのでは? という、何とも切ない結論になるのかも知れない。
これからの情報提供手段として想像できるもの
上記の流れから、mixiから一時的に人間が分散している状況になっているのでは無いかというのが、願望含みな判断だと思う。そしてその人達はmixiの時に味わった、人とつながった時の面白さを、またどこかでと期待しているわけで、それがtwitterなのか、facebookなのか、それとも全然別のものなのか、はたまたもう一度mixiなのか、模索している状況なのかも知れない。
今のところ、twitterが主力になっているようだ。facebookも最近登録ユーザーが増えてきている印象がある。mixiが爆発的に広まったように、これらのサービスがいつ爆発的に普及するのか分からない。
ということで、当面は、mixi、twitter、facebookと、複数のSNSそれぞれの特性を見極めながら、そこにいるユーザーに向けて情報提供をし続けるという、手間だけど、それが最も安全な方法なんでは無いだろうかという、いたって当たり前の結論になった。mixiの成功が鮮烈過ぎたのもあるだろうけれど、なんとも地味な話ではある。
セブンイレブンでA3カラーを出力
A3カラーを出力できるレーザーが手元に無いため、書籍のオリジナル帯作りに、ネットプリントを利用した。仕様はこちら。
ざっとな使い方。
- 印刷用のPDFを作成する。その際、フォントが化けないように文字はアウトライン化しておくと良い。(ファイルサイズ制限があるので、フォント埋め込みは2MB上限のファイルサイズオーバーする恐れがある)
- サイトでアカウントを作ってログイン。
- 作成したPDFをアップロードする。アップロードすると「プリント予約番号」が作成されるのでメモする。
- セブンイレブンに行って、「プリント予約番号」を入力してファイルを呼び出す。
- コピーをするのと同じ要領でお金をいれて印刷。
出力時にはアカウント不要で「プリント予約番号」があれば良いので、ファイルアップ後に他の人に頼んで出力してもらえたり、遠隔地複数個所で同時に出力することも可能なのが良い所。1ファイルの容量上限が2MBなのがもう少し大きくなればもっと使い道が増えそうだ。