Мы в Telegram
Добавить новость
Новости сегодня

Новости от TheMoneytizer

Разработать backend и API для платформы публикации научных данных

Внимание, описание задачи на английском. Присылайте Ваше резюме и оценку стоимости работ в отклике на объявление.

General project description:

We are working on a publishing platform for scientific data. Our users should be able to publish datasets with descriptions and group them, search through published entities, download them and receive notifications about new data on interesting topics.

Similar projects to look up:

https://zenodo.org/

https://figshare.com/

Current state:

We are planning to split our work into 2 stages:

1. Writing the backend and API for the publishing platform.

2. Writing the user interface.

This task is for the backend and API.

Right now we have defined API requirements and their basic structure. We haven’t written any code yet, so you have carte blanche for suggesting technologies, and also you won’t deal with any legacy code :)

Publishing API & Backend:

Main Functionality:

Data publishing - upload data with description.

We want to support two general cases:

1. Upload files directly.

2. Providing links for files that are hosted elsewhere.

Basic types that we want to support:

1.Tables: CSV, TSV, Microsoft Excel (.xls, .xlsx); Nice to have: OpenDocument/OpenOffice

2.Text-based: TXT, JSON

3.Images: common formats

4.Word documents

5.PDF

6.Dataset group - a group of datasets within the system.

In the future, this list can be extended, so the proposed system design should be extensible for introducing new formats.

As mentioned above, we also want to allow publishing groups of datasets, to organize hierarchical relationships. We also want to provide some metadata in a dataset: author, date of publication, tags, version, links.

Data storing - assigning IDs to published entities, retrieving them by ID, updating the entities.

One of the main requirements for storage - it should be efficient for running various search queries for datasets (search by type, running the full-text search, search by publisher, search for linked data (including non-direct neighbors)).

We also should be able to update the parameters of entities like tags and links.

We also want to store all versions, so after an update, we will get a version from the update request (or autoincrement if none) and store the updated and the previous versions. Of course we need to be able to get previous versions too.

Data search - running a search query and providing the results of the search.

As it was mentioned earlier, we want to support different types of search:

1. We want to allow to search based on some strict conditions, like: ”search only type: .csv” will result in only CSV files.

2. We want to support full-text search and ranking like: “search for: pasta dataset“ will result in a ranked list where the first results are datasets where a heading contains “pasta”, followed by datasets that mention something like “spaghetti“.

3. We want to combine conditions, e.g.:

”search only type: .csv” && “search for: “pasta dataset”“, and our result would be ranked pasta datasets of only .csv format.

Our basic ideas:

1.Search in the dataset description

2.Search in the first N rows of the dataset

3.Search by author, tags.

4.Search in the range of time

Notifications - subscribe for a search query and run it periodically, then send the update to a user.

In the future we want to send updates to a user about new datasets that we found for a query, so we want to be able to create a request that will store a task to periodically run a search request that our user will define.

It’s not urgent right now but this functionality should be kept in mind while designing the solution.

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

США выведут свои войска из Нигера до 15 сентября

Крупную партию наркотиков обнаружили в квартире на севере Москвы

В Москве пропавшую в Измайловском парке 13-летнюю девочку нашли мёртвой

Ефимов: в столице заработал сервис проверки нахождения участков, включенных в программу КРТ

Музыкальные новости

РОССИЯ И КИТАЙ: В МИРЕ ВОЗМОЖНА ГЕГЕМОНИЯ ЛИШЬ ИНТЕРЕСА НАРОДА, ЗАКОНА, ИСТИНЫ И СПРАВЕДЛИВОСТИ.

Актер из «Папиных дочек» пропал в Москве

Открытие восьмого сезона программы «Военные оркестры в парках» в Подмосковье

Наследие Шаляпина и Рахманинова представили на выставке-форуме «Россия»

Новости России

Лавров: лидеры стран Запада врут, когда обвиняют РФ в перекрытии поставок газа

Синоптик Шувалов предупредил о дождях и похолодании в Москве на предстоящей неделе

Московский Весенний велофестиваль привлек свыше 65 тысяч участников

Велосипедистам дали дорогу // Как в Москве устроена инфраструктура для двухколесного транспорта

Экология в России и мире

«585*ЗОЛОТОЙ» назвала топ-10 самых популярных драгоценных камней в России

Кладезь полезных свойств: Кутушов рассказал о пользе шлемника байкальского

Россия, Культура, Теат, Дети, ПДД: кукольным языком о дорожной безопасности детям показали в Ульгэре

Где провести бизнес-встречу в Ростове-на-Дону?

Спорт в России и мире

Соболенко — Коллинз: белоруска выиграла первый сет в полуфинале Рима

Новак Джокович: «Я никогда не скажу, кого считаю величайшим в истории – оставлю это другим»

Соболенко вышла в полуфинал турнира WTA в Риме

Путинцева вернулась после 0:6 и одержала важную победу

Moscow.media

«Грузовичкоф» развивает представителей бизнес-среды

Правоохранители проверили бывших мигрантов в Джанкое

МОСКОВСКИЙ ФЕСТИВАЛЬ ПОД ФЛАГОМ РУССКИХ СУПЕРГЕРОЕВ.

Терминал сбора данных (ТСД) промышленного класса SAOTRON RT42G







Топ новостей на этот час

Rss.plus





СМИ24.net — правдивые новости, непрерывно 24/7 на русском языке с ежеминутным обновлением *