我需要将静态内容网站迁移到 IBM Web Content Manager。 基本上我们有大量的 HTML 页面。还有很多从 HTML 页面引用的 Word 和 PDF 文档。
我们需要使用爬虫提取内容,然后将该数据集成而不是导入到 IBM Web Content Manager。
成功完成此迁移的最佳做法是什么?
IBM WCM 中是否有批量导入功能?
是否可以通过某些 API 或服务自动创建页面和组件的过程?
如何批量导入 Word 文档和 PDF,将它们存储为可从迁移页面引用的组件。 问候。
最佳答案
要导入内容,您可以尝试两种选择:
IBM Web Content Integrator简而言之,您需要创建提要 您现有网站上有关门户定义的规则的来源。 之后,您需要在门户网站上创建消费者提要并获取 内容到 WCM。
使用 WCM api 创建门户应用程序并从任何 您拥有的来源 - 提要、数据库、文件等
要创建门户页面/组件(如图像、文件、html),您还可以使用门户/WCM api。但在导入内容之前,请确保您了解内容和组件之间的区别,并决定您想要创建什么 - 内容或组件,如内容源。此外,关于以编程方式创建页面的信息较少,但它是可能的。
如果您打算使用 JSR 286 portlet 来显示 contnet,请查看 XML 导入工具。通过这种方式,您可以自动配置并避免对每个页面进行手动配置。页面配置 - 它只是 xml 文件,您始终可以使用 java 修改此文件并为特定页面应用更新的文件。
更新
以编程方式创建门户页面
import com.ibm.portal.ModifiableMetaDataProvider;
import com.ibm.portal.content.*;
import com.ibm.portal.model.ContentModelHome;
import com.ibm.portal.model.ContentModelProvider;
import com.ibm.portal.model.controller.ContentModelControllerHome;
import com.ibm.portal.model.controller.CreationContextBuilderFactory;
import com.ibm.portal.model.controller.exceptions.CannotInstantiateControllerException;
import com.ibm.workplace.wcm.services.addressability.FriendlyURLFactoryImpl;
import com.ibm.wps.pe.pc.std.core.PortletUtils;
import javax.naming.Context;
import javax.naming.InitialContext;
import javax.portlet.*;
/**
* @author : Georgy Gobozov
* @created : 12.03.13
*/
public class PageUtil {
private static final String PREF_PARENT_PAGE = "parent.page.unique.name";
private static final String PREF_UNIQUE_PREFIX = "pages.unique.name.prefix";
public static boolean createPortalPage(String title, ActionRequest request, ActionResponse response) {
PortletPreferences prefs = request.getPreferences();
String parentPageUniqueName = prefs.getValue(PREF_PARENT_PAGE, "wps.content.root");
String uniqueNamePrefix = prefs.getValue(PREF_UNIQUE_PREFIX, "study.portal.pages.");
ContentModelController ctrl = null;
CreationContextBuilderFactory factory = null;
ContentPageCreationContext ctx = null;
ModifiableContentPage newPage = null;
ContentNode parent = null;
try {
ctrl = getController(request, response);
factory = CreationContextBuilderFactory.getInstance();
// Use the context to create the private page
ctx = factory.newContentPageCreationContext(true);
newPage = (ModifiableContentPage) ctrl.create(ContentPage.class, ctx);
newPage.setTitle(request.getLocale(), title);
// set page unique name
newPage.getModifiableObjectID().setUniqueName(uniqueNamePrefix + title);
parent = (ContentNode) ctrl.getLocator().findByUniqueName(parentPageUniqueName);
if (parent != null) {
ctrl.insert(newPage, parent, null);
// set friendly name
ModifiableMetaDataProvider mmdp = (ModifiableMetaDataProvider)ctrl.getModifiableNode(newPage);
mmdp.getModifiableMetaData().setValue("com.ibm.portal.friendly.name", title);
// Commit, i. e. persist the changes.
ctrl.commit();
}
} catch (Exception e) {
e.printStackTrace();
} finally {
if (null != ctrl)
// Dispose the Controller.
ctrl.dispose();
}
return true;
}
public static ContentModelController getController(PortletRequest request, PortletResponse response) {
ContentModel aContentmodel = null;
ContentModelController ctrl = null;
ContentModelControllerHome home = null;
try {
Context ictx = new InitialContext();
ContentModelHome homea = (ContentModelHome) ictx.lookup("portal:service/model/ContentModel");
if (homea != null) {
ContentModelProvider provider = homea.getContentModelProvider();
PortletUtils.getInternalRequest(request).getHttpServletRequest();
//aContentmodel = provider.getContentModel((ServletRequest) request, (ServletResponse) response);
aContentmodel = provider.getContentModel(PortletUtils.getInternalRequest(request).getHttpServletRequest(), PortletUtils.getInternalResponse(response).getHttpServletResponse());
}
home = (ContentModelControllerHome) ictx.lookup(ContentModelControllerHome.JNDI_NAME);
if (home != null) {
try {
ctrl = home.getContentModelControllerProvider().createContentModelController(aContentmodel);
} catch (CannotInstantiateControllerException e) {
e.printStackTrace();
}
}
} catch (Exception e) {
e.printStackTrace();
}
return ctrl;
}
}
更有用的类(class)here
关于websphere-portal - 将网站迁移到 IBM Web Content Manager 8,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23908858/