מיקרוסופט פרסמה את Markitdown v0.1.0, כלי פייתון שיכול להמיר תמיכה בתוסף, המרת זיכרון, מסמכי משרד התומכים בפורמטים של Epub וכו 'לסימון.

מיקרוסופט פרסמה את "Markitdown v0.1.0", ספרייה המאפשרת לך להמיר תמיכה בתוסף, המרת זיכרון, מסמכי משרד התומכים בפורמטים של Epub וכו 'לסימון. לפרטים נוספים, ראה להלן.


בדצמבר 2024, אדם פורני מקבוצת החוויות האנושיות של מיקרוסופט (HAX) המירו קבצים שונים לפורמט Markdown על מנת להמיר PDF, קבצי משרדים ומידע באתרים הדרושים לפיתוח AI למבוססת טקסטים (Markdown).「MarkitDown」כלי פיתון/ספריותעם זאת, MarkitDown זה עודכן מאז V0.0.2.「Markitdown v0.1.0」זה שוחרר כמו

גרסה 0.1.0 (בעבר 0.1.0A6) היא מהדורה גדולה, ומביאה שיפורים רבים על גרסת 0.0.2 הקודמת.

קטע מתוך הערות השחרור

MarkItdown V0.1.0 מארגן תלות בפורמט, ומאפשר לך להתקין רק את הממירים הדרושים כמו PDF, DOCX, PPTX, XLSX ועוד, והמרה ל- *Markdown מבוצעת כעת בזיכרון, והמרת פורמט EPUB נתמכת כעת.

*כדי לשמור את כל התלות, ממש כמו בגרסאות קודמות, התקן עם "PIP להתקין" MarkItdown [ALL] '".

בנוסף, גרסה זו הוסיפה פיתוח תוספים של מפתחי צד ג ', אפשרויות לשמירה על URIS נתונים בסימון, ועיוב על סוגי MIME, תוספים ותווים, ושינויים רבים בוצעו, כך שאם אתה מפתח שירותי אינטרנט או כלים המשתמשים ב- MarkitDown, בדוק זאת.

אפשרויות MarkitDown v0.1.0

Markitdown v0.1.0

סקירה כללית

גרסה 0.1.0 (בעבר 0.1.0A6) היא מהדורה גדולה, ומביאה שיפורים רבים על גרסת 0.0.2 הקודמת.
שינויים ברמה גבוהה כוללים:

  • תלות מאורגנת בקבוצות תכונות - התקן רק את הממירים הדרושים לך, או קבל הכל עם PIP להתקין MarkItdown [הכל]
  • ארכיטקטורה חדשה מבוססת תוספים, המאפשרת למפתחי מפלגה 3 להוסיף פונקציונליות ל- MarkitDown (ראה את התוסף לדוגמא)
  • כל ההמרות מבוצעות בזיכרון-אין עוד קבצים זמניים
  • תמיכה בפורמטים חדשים כולל epub
  • אפשרות לשמור על URIS של נתונים בסימון המרה
  • אפשרות לעקוף את סוג MIME, סיומת ושיחוד בממשק שורת הפקודה (שימושי בעת קריאת קלט מצינור או מסטדין)