GitHub - microsoft/markitdown: Python tool for converting files and office documents to Markdown.
2024/12/15 13:40
人気記事
Rustで進化するPayPayのスケーラビリティ
中国の若い世代が偽のお腹をつけマタニティフォトを撮影するという謎ブーム|カラパイアカラパイア不思議と謎の大冒険カラパイア
【2025年春。新しい朝を。新しい出会いを。新しい仲間と。】TBSラジオ2025年4月からのタイムテーブルを一挙大公開! | TBSラジオ
AI時代に必要なのはプログラミング能力ではなくコンピューティング能力 - きしだのHatena
「ハリウッドは無意識のうちに女性を排除してきた。だけど……」映画『エミリア・ペレス』で出演者たちが最も伝えたかったこと | 文春オンライン
ずん
えーっと、MarkItDownってなんなのだ?PythonでMarkdownに変換するツールらしいけど、そんなの必要なのか疑問なのだ。
でぇじょうぶ博士
おお、良い質問でやんす!MarkItDownは、オフィス文書や画像をMarkdown形式に変換する便利ツールでやんす。特にテキスト分析やインデックス作成を行う人には重宝されるでやんすよ。
やきう
は?Markdownなんて手打ちで十分やろ。わざわざこんなもん使うとか甘えすぎちゃうか?
ずん
いやいや、手打ちとか面倒くさいのだ。自動化できるならそっちがいいに決まってるのだ。
でぇじょうぶ博士
やきう殿、それは時代遅れの考え方でやんすよ。例えば、大量のWordファイルを一括変換したい場合、このツールがあれば数秒で済む話でやんす。
やきう
数秒とか言われてもなぁ...ワイはそもそもWordファイルなんて触らへんし関係ないわ。
ずん
でも博士、このツールって画像説明にもLLM(大規模言語モデル)を使えるらしいけど、それってどういうことなのだ?
でぇじょうぶ博士
素晴らしいポイントでやんす!例えば画像内の内容をAIが解析して、その説明文を自動生成してくれる機能があるということでやんすね。ただし、そのためにはmlm_clientとmlm_modelという設定が必要になるみたいでやんす。
ずん
AIまで使えるとは...未来的なのだ。でも設定とか難しそうだからボクには無理っぽいのだ。
やきう
未来的っつーか、逆にそこまでしてMarkdown作りたい奴おるか?普通に考えて趣味悪いやろ。
ずん
趣味悪いとか言わないのだ。でもプルリクエスト出したらCLAボットが出てくるって聞いて怖くなったのだ。ロボットに監視される気分なのだ...
でぇじょうぶ博士
CLAボットはただ手続きを簡略化するだけなので安心するでやんす。それよりも、このプロジェクトはMicrosoftオープンソース行動規範を採用しているので、安全性と透明性が確保されている点も評価できると思うでやんすよ!
ずん
ボクとしては「安全」と「簡単」が一番大事なのだ。でも結局これ使ったところでモテたりしないなら意味ない気がしてきたのだ...